手書き→活字変換モデルを学習しようとして上手くいかなかった話 | NTT docomo Business Engineers' Blog
こんにちは。イノベーションセンターの加藤です。 手書きから活字へスタイル変換するモデルをFlow Matchingで学習しようとして色々試したものの上手くいかなかったため、試行錯誤の記録をブログの形で残したいと思います。 背景 上手くいかなかった手法たち 手法1:手書き文字分布から活字分布への変換 手法2:ControlNet学習 手法3:学習済みの活字生成モデルを手法1で転移学習する まとめ 背景 このモデルを学習しようとしたきっかけは手書き文字OCRの性能を向上させようという取り組みでした。OCRの難しい点として、現実のデータにはさまざまな特殊文字が現れるという問題があります。これら全ての…
元の記事を確認する