深層学習
こんにちは!!!クライアントエンジニアの小林です。今回は以前に投稿した内容、アドベンチャーゲームに特化した日本語文字認識の続編です。 作業環境 概要 リポジトリ 文字領域の検出(CRAFT) Character Region Awareness for Text Detection 単語と文章の生…
こんにちは!!!クライアントエンジニアの小林です。今回はニューラルネットワークの万能近似定理を利用してベースカラーとシャドウカラーの可逆性が求められないか検証してみます。 作業環境 概要 万能近似定理とは 方針 データセットの作り方 色空間による入…
こんにちは!!!クライアントエンジニアの小林です。今回はDistilBERTのMaskedLMを利用して類似文字を推定してもらいます。 概要 DistilBERTとは 自然言語とは BERTとは Transformerとは DistilBERTとは(おかえり) Tokenizerとは MaskedLMとは FineTuningと…
こんにちは!!!クライアントエンジニアの小林です。今回はVGG16とCRAFTにGhostModuleを組み込んでみました。 作業環境 概要 モデル VGG16 CRAFT GhostModule Ghost-VGG16-BN モデル models\ghost_module.py models\ghost_vgg.py データセットのダウンロード …
こんにちは!!!クライアントエンジニアの小林です。今回はSageMaker Serverless Inferenceを使用してPyTorchな推論モデルをサーバーレスで動かしていきます。 作業環境 概要 SageMaker Serverless Inferenceとは SageMaker Serverless Inferenceの料金プラン …
こんにちは!!!クライアントエンジニアの小林です。今回はノベルゲームでの使用を想定した、いわゆる領域特化な日本語OCRを作ってみました。 作業環境 概要 リポジトリ 環境構築 文字領域の検出(CRAFT) データセット word image generator text image gener…
こんにちは!!!クライアントエンジニアの小林です。今回はTesseractのFineTuningをWindows環境で実行する方法をまとめました。 目次 目次 概要 作業環境 Tesseractのインストール リポジトリの取得 venv環境の構築 実行方法 Stage0: 使用可能なフォント一覧の…
こんにちは!!!クライアントエンジニアの小林です。趣味で触っているコーパス作成の過程でテキスト入力を自動化したいなぁと思いOCRを導入してみました。 cloud visionはAPI叩くスタイルなので鯖落ちとか面倒だなぁと思い、ローカルで動作するtesseractを選び…