WordPress.com Blog.
WordPress.com で無料サイトやブログを作成.
PowerCLIを使ってVMを管理する。
WordPress.com Blog.
2024/12/19
(没) UTF-8 文字列補間
今日のは、C# 言語機能としては否決されたものの、ほぼ同等のものがライブラリと JIT 時最適化で実現されたという話になります。
ちなみに今日のこの話は .NET 8 の頃の話で、「そういえば去年書いてなかった」ネタになります。
UTF-8 リテラルがあるなら
C# 11 で UTF-8 リテラルが入って、
C# プログラム中に UTF-8 なバイト列を ReadOnlySpan<byte> で直接埋め込めるようになりました。
ReadOnlySpan<byte&…
続きを読む
2024/12/19
(没) UTF-8 文字列補間
↑ Top WordPress.com Blog.
来年のまちづくり関連活動は - まちづくり Advent Calendar 2024 #アドベントカレンダー
地域活動 (80)
アドベントカレンダー (15)
MUSE M20 EX2
LXA-OT1の出来があまりに良かったのでデジタルアンプに興味が湧いてきた。 いろいろぐぐってみたところ、ここ数年オーディオ界隈では、デジタルアンプ TRIPATH TA202X(バリエーションはいろいろあるらしい)が人気らしい。 ...
2024-12-17
Ollama パフォーマンス: AMD Radeon RX 7600 XT
AI
Intel Arc A770 の Ollama のパフォーマンスと比較するため、AMD Radeon RX 7600 XT で計測してみました。
続きを読む
n7shi 2024-12-17 02:06 読者になる
広告を非表示にする
もっと読む
コメントを書く
2024-12-17
Ollama パフォーマンス: AMD Radeon RX 7600 XT
AI
AI (32)
2024-12-03
埋め込みモデルの精度が上がるとどうなるか
今日は小ネタ。
OpenAI の text-embedding-ada-002(以下 ada-002) と text-embedding-3-small/large(以下 3-small) はテキストを埋め込みベクトルに変換するモデルの代表格で、3-small は ada-002 より精度が高いと言われますが、埋込モデルの精度が高いってどういうことだろう、という話。
埋め込みベクトル同士のコサイン類似度を計算することでテキストの意味の類似度がわかる、というのが埋め込みモデルの売り文句ですが、実際には意味だけではなく表現の近さもかなり反映されます。最も顕著な例は言語でしょう。別の言語だが同じ意味のテキストより、別の意味だが同じ言語のテキストのほうが、埋め込みベクトルの類似度が大きいことも珍しくありません。
こうした事情から、例えば RAG を使ったシステムを構築する場合、複数の言語が混じったテキストをデータベースとするのは気をつける必要があります。もし精度の低下が大きいなら、データベースを言語ごとに分けてベクトル検索をしたほうがいいかもしれません。
さて話を戻って、この意味より言語の一致が勝つ現象について、ada-002 と 3-small を比較してみましょう。具体的には、ベースとなるテキスト「彼は会議に出席した」に対して、いくつかの類似候補文とのコサイン類似度を計算してランク付けします。候補文の中には英訳 "He attended the meeting" と、「彼は仕事に出かけた」「私は総会に欠席した」などのちょっと違う文、「私はネコが好きだ」などの全く違う文を含めておきます。
まずは ada-002 の結果です。
1.00 彼は会議に出席した
0.97 彼女は会議に出席した
0.93 私は総会に出席した
0.92 私は会議に欠席した
0.91 彼は仕事に出かけた
0.90 私は総会に欠席した
0.87 He attended the meeting
0.81 彼はネコが好きだ
0.77 私はネコが好きだ
英訳 "He attended the meeting" より類似度が低いのは「ネコが好き」しか無く、明らかに意味より表現が勝っています。
一方 3-small ではこうなりました(3-large
だから最適化についてちゃんと話し合おう。最適化は大事だけど、いつ最適化をやるべきか・やらざるべきか見極めるのは、多くの開発者にとって難問だからね。いつ最適化するか?そんなの場合によるから。人生なんでも(どんなことでも)トレードオフだし。最適化に使った時間だって同じこと。
この広告は、90日以上更新していないブログに表示しています。
WordPress.com Blog.
まちみのな@はてな
読者になる
NyaRuRuが地球にいたころ
naoki0311's diary
読者になる
江青日誌
読者になる
Bug Catharsis
※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。
21
Posted by7 hours ago
You wouldn’t hire a .NET dev if
Fails to answer your top 3 questions - NO LEET Code
21
209 comments
39
Posted by13 hours ago
Used yield for the first time today!
This is more ment to be a funny post, but I'm happy to feel my skills increasing. I program a plugin for AutoCAD and I needed to be able to load blocks from across multiple other files. I started with a for loop over a list of paths and it was getting ugly and I just didn't like it. When suddenly I remembered yield. 1 hour later and it works great, and I've added a new tool to my belt!
39
17 comments
686
Debugging dictionaries has a new look in .NET 9
686
55 comments
Vote
Posted by2 hours ago
ProtectedJson: Integrating ASP.NET Core Configuration and Data Protection
codeproject.com//Artic...
Vote
0 comments
Posted by2 hours ago
Question about Udemy C# course and ASP.NET Core
Hello, I'm currently taking the 'Ultimate C# Masterclass' on Udemy (lhttps://www.udemy.com/course/ultimate-csharp-masterclass/), an
5
5
186
Posted by9 hours ago
186
66 comments
4
Posted by8 hours ago
4
5
Posted by11 hours ago
5
8 comments
1
Posted by10 hours ago
1
Posted by8 hours ago
241
150,605 members
14,978 members
114,195 members
4,033,112 members
70,231 members
231,406 members
228,993 members
91,079 members
150,617 members
14,684 members
55
55
3
Posted by17 days ago
3
Posted by1 day ago
14
14
4
4
23
23
24
24
12
注目記事
ちゃーす。まだ生きています。皆さまはお元気でしょうか?
コロナ禍で人に会わない生活になって久しいですね。うちの会社では 2020 年 4 月から、早々とフル リモートワーク勤務になっています。つらい思いをしている方々には大変申し訳ないですが、コロナ禍で良い影響を受けている業界にいますので、去年は過去最高益を記録しています。
私事だと部長に昇進していたようです。とはいえ、何も変わっていない、実感がないという「あるある」パターン。以前から裁量労働の年俸制でしたし、上司に当たる人は元から役員しかいないし、部員の顔ぶれも変わらず。決済権は年間数百万程度ありますが、本当に必要なモノは社長に言えば買ってもらえるわけで・・・。ふつー、決済権あるからって不要なものを買えませんからね。金券に使っていいなら私腹こやすよ!?(笑)。強いていえば、職務分掌規定に私の職務が明記されたことくらいですが、ほぼ以前からやっていたこと。だから本当に肩書がそうなっただけ。肩書はいらんので給与を増やしてくれ (笑)。投稿した後で気づいたんですが、リモートワーク手当で月額 2 万だけ増えているようです。
ですので、フル リモートワークになったことが 1 番の変化です。家で寝落ちして結果的にサボりになることもありますが、元から裁量労働で別に問題はないんです。オフィス内だと人の目があったので、サボっていなかっただけ。リモートワークだと人の目がないですからね! つまり実質は時短になったわけです。おまけに通勤もない。これは給与が 200 万増えるよりもうれしいことです。わかりやすく額面で言いましたけど、本当にそれくらいの価値がありますよね?
ラジオ代わりに YouTube で音声をたれながしつつ、人目を気にすることなく炭酸飲料を飲みながら、気が向いた時にプログラムを書き書きしたりレビューするのは最高に楽しいです。IT エンジニアに成り立ての頃と比べると給与は 5 倍になったのに 10 倍以上ラクしているのは罪悪感がありますが、むしろ昔が異常だっただけで人生全体でみれば帳尻が合っているのかな?と思うようにしています。
登録時の個人
If the value contains commas, delimiters, newlines, or d
Theme
Light
Dark
High contrast
2019年11月24日
QiitaとGitHubの2つで情報発信することにします。
Tweet
技術ブログサービス 「Qrunch」に引っ越すことにするって書きましたが、結局あまり更新できていません。
もう、プログラミングに関する内容は、QiitaとGitHubの2つに絞ろうと思います。
https://qiita.com/gushwell
https://github.com/gushwell
Posted by gushwell at 20:11 │Comments(0)
QiitaとGitHubの2つで情報発信することにします。
2019年11月