▽natural language processing blog ●06/14 23:57 Daniel Lemire’s blog In C++, is empty() faster than comparing the size with zero? An urgent puzzle Data Wrangling Introducing Trifacta’s integration with dbt Core on Google BigQuery
▽CUBE SUGAR CONTAINER ●06/06 15:54 2022-02-05 dbt (data build tool) を使ってデータをテストする dbt SQL Postgresql Mac OS X ソフトウェアエンジニアリングの世界では、自動化されたテストを使ってコードの振る舞いを検証するのが当たり前になっている。同じように、データエンジニアリングの世界でも、自動化されたテストを使ってデータの振る舞いを検証するのが望ましい。 データをテストするのに使える OSS のフレームワークも、いくつか存在する。今回は、その中でも dbt (data build tool) を使ってデータをテストする方法について見ていく。dbt 自体はデータのテストを主目的としたツールではないものの、テストに関する機能も備えている。 また、dbt には WebUI を備えたマネージドサービスとしての dbt Cloud と、CLI で操作するスタンドアロン版の d
▽銀座で働くデータサイエンティストのブログ ●06/01 17:08 2022-01-14 生活者ターゲティングの時代は終わり、エコノメトリクスによるマーケティングが台頭する データ分析 マーケティング 統計学 (Image by Mediamodifier from Pixabay) 実はもう1年以上前のことなのですが、LinkedInで以下の記事を見かけて「おー、ようやくこういう意見が公の場に出てくるようになったんだな」と思ったのでした。原文は英語ですが、短い文章なので英語が不得手な方でも各種翻訳サービスなどを使えばサクッと読めるのではないかと思います。 Death of the Deterministic Identifier There is more and more speculation in the press on how the industry will navigate the death of the cookie. However
▽Mi manca qualche giovedi`? ●05/21 21:00 NLP Google Colaboratory colab.research.google.com Papers with Code - IMDb Benchmark (Sentiment Analysis) The current state-of-the-art on IMDb is NB-weighted-BON + dv-cosine. See a full comparison of 30 papers with code. paperswithcode.com iir/rr-vb.py at master 揃 shuyo/iir Machine Learning / Natural Language Processing / Information Retrieval - iir/rr-vb.py at master 揃 shuyo/iir github.com 木曜不足 id:n_s