Cordwainerのアンテナ
id:Cordwainer
2/5ページ
▽「うさぴょん」「ねこにゃ」開発日記●02/29 22:11 1 2 34 5 6 7 8 9 1011 12 13 14 15 16 1718 19 20 21 22 23 2425 26 27 28 29何年ぶりだっけ2024年2月26日 (月)何年ぶりだっけ「うさぴょん異聞」の開発始めました。評価関数はDeepLearning系で、ポリシーネットなし、バリューネットのみで、探索部分をどれ位頑張れるのか、バリューネットはどれ位正確になるのか、みたいな感じです。バリューネットの方は、mEssiahの中の人さんが強化学習を頑張ってくれています(ある程度の成果は上がってる)ので、私は探索部分頑張って、今年(2024年)の年末ごろの電竜戦か、来年(2025年)の世界コンピュータ将棋選手権に間に合うといいな…。生存報告を兼ねて(そして忙しい仕事の現実逃避を兼ねて)久し振りに投稿。2024年2月26日 (月) 「うさぴょん」開発 |
▽コンピュータ将棋や囲碁の掲示板●01/19 21:55 全3117件の内、新着の記事から10件ずつ表示します。AobaZeroの初期局面での初手のPolicyの変遷。▲76歩は衰退投稿者:山下 投稿日:2022年 1月18日(火)17時33分2秒 編集済AobaZeroの初手のPolicyの変遷を調べてみました。初手▲26歩は最初(500万棋譜)から0.66と高いです。ただ徐々に下がっています。▲76歩は1000万棋譜では0.31と高かったのですが、その後衰退、5000万棋譜では0.007まで下がってます。徐々に上がってきたのが▲78金。ただこれは10手後くらいには▲26歩と同じ形になるので(▲26歩△84歩▲25歩△85歩▲78金△32金・・・・)手順前後程度の意味しかないかもしれません。▲16歩や▲38銀がじわっと上がってきています。▲26歩、▲78金がずっと主流なので相掛かりに似た戦型だらけになっています。個人的には
4.<前5 6.次5>
0.はてなアンテナトップ
8.このページを友達に紹介
9.このページの先頭へ
□ヘルプ/お知らせ
□ログイン
□無料ユーザー登録
□はてなトップ
(c) Hatena