テキストエンベディング再入門 | シナプス技術者ブログ


シナプスの技術部システム開発課の小園です。 これまで感覚的に用いることの多かったテキストエンベディングについて、その仕組みと活用法を深く掘り下げてみました。 当初は「似た文章をベクトルで探す仕組み」という程度の認識でしたが、学習を進めるうちにその奥深さに触れる良い機会となりました。 テキストエンベディングとは? ベクトルデータの特徴 テキストエンベディングのモデル テキストの「近さ」はどう測る? なぜ「距離(ユークリッド距離)」ではなく「角度(コサイン類似度)」なのか? テキストエンベディングは何に使える? AIが言葉を理解するまでの2つのマイルストーン 代表的な文脈化埋め込みのテキストエンベ…


元の記事を確認する

関連記事