SPARKCREATIVE Tech Blog

https://www.spark-creative.jp/

深層学習

ニューラルネットワークで原作再現な色作りができないか試してみた

こんにちは!!!クライアントエンジニアの小林です。今回はニューラルネットワークの万能近似定理を利用してベースカラーとシャドウカラーの可逆性が求められないか検証してみます。 作業環境 概要 万能近似定理とは 方針 データセットの作り方 色空間による入…

FineTuning DistilBERT with Masked Language Model

こんにちは!!!クライアントエンジニアの小林です。今回はDistilBERTのMaskedLMを利用して類似文字を推定してもらいます。 概要 DistilBERTとは 自然言語とは BERTとは Transformerとは DistilBERTとは(おかえり) Tokenizerとは MaskedLMとは FineTuningと…

VGG16とCRAFTにGhostModuleを組み込んでみた

こんにちは!!!クライアントエンジニアの小林です。今回はVGG16とCRAFTにGhostModuleを組み込んでみました。 作業環境 概要 モデル VGG16 CRAFT GhostModule Ghost-VGG16-BN モデル models\ghost_module.py models\ghost_vgg.py データセットのダウンロード …

SageMaker Serverless Inference + PyTorch + Lambda + API Gateway

こんにちは!!!クライアントエンジニアの小林です。今回はSageMaker Serverless Inferenceを使用してPyTorchな推論モデルをサーバーレスで動かしていきます。 作業環境 概要 SageMaker Serverless Inferenceとは SageMaker Serverless Inferenceの料金プラン …

Tesseract 5.2 Fine Tuning

こんにちは!!!クライアントエンジニアの小林です。今回はTesseractのFineTuningをWindows環境で実行する方法をまとめました。 目次 目次 概要 作業環境 Tesseractのインストール リポジトリの取得 venv環境の構築 実行方法 Stage0: 使用可能なフォント一覧の…

Tesseract ノベルゲームに特化した日本語OCR(文字認識)をしてみた

こんにちは!!!クライアントエンジニアの小林です。趣味で触っているコーパス作成の過程でテキスト入力を自動化したいなぁと思いOCRを導入してみました。 cloud visionはAPI叩くスタイルなので鯖落ちとか面倒だなぁと思い、ローカルで動作するtesseractを選び…