mattosonのｱﾝﾃﾅ - はてなｱﾝﾃﾅ

▽Mi manca qualche giovedi`?
●12/05 05:51 統計的機械学習
2024-12-03埋め込みﾓﾃﾞﾙの精度が上がるとどうなるか今日は小ﾈﾀ｡OpenAI の text-embedding-ada-002(以下 ada-002) と text-embedding-3-small/large(以下 3-small) はﾃｷｽﾄを埋め込みﾍﾞｸﾄﾙに変換するﾓﾃﾞﾙの代表格で､3-small は ada-002 より精度が高いと言われますが､埋込ﾓﾃﾞﾙの精度が高いってどういうことだろう､という話｡埋め込みﾍﾞｸﾄﾙ同士のｺｻｲﾝ類似度を計算することでﾃｷｽﾄの意味の類似度がわかる､というのが埋め込みﾓﾃﾞﾙの売り文句ですが､実際には意味だけではなく表現の近さもかなり反映されます｡最も顕著な例は言語でしょう｡別の言語だが同じ意味のﾃｷｽﾄより､別の意味だが同じ言語のﾃｷｽﾄのほうが､埋め込みﾍﾞｸﾄﾙの類似度が大きいことも珍しくありません｡こうした事情から､例え