タグ Yotaro Katayama
人気順 5 users 50 users 100 users 500 users 1000 users機械学習プロダクト開発の「2年目」とこれから|Yotaro Katayama|note
自然言語処理・機械学習を用いて、企業に眠っている契約書を資産として活用できるようにしていくサービスを作っているMNTSQの堅山です。 弊社の機械学習チームは、契約書データから様々な情報を抽出し、人が活用できるようにするのがの役割です。例えば、誰が相手の契約か?この条項と同じタイプの条項は他にあるか?な... 続きを読む
Feature Importanceって結局何なの?|Yotaro Katayama|note
この記事の目的GBDT(Gradient Boosting Decesion Tree)のような、決定木をアンサンブルする手法において、特徴量の重要性を定量化し、特徴量選択などに用いられる”Feature Importance”という値があります。 本記事では、この値が実際にはどういう計算で出力されているのかについて、コードと手計算を通じて納得すること... 続きを読む
catboostの推論の仕組みを理解する (1/2)|Yotaro Katayama|note
この記事の目的catboostというライブラリがあります。GBDT(Gradient Boosting Decesion Tree )という決定木をアンサンブルする方式の識別モデルを学習するものです。同様のライブラリは他にはXGBoostやLightGBMなどが有名です。 GBDTって何やっているの?というのは以下のXGBoostのドキュメントの画像がわかりやすいです... 続きを読む
機械学習プロダクトで「スクラム」的開発をやってみてわかったこと|Yotaro Katayama|note
こんにちは、MNTSQというリーガルテックの役員をしている堅山といいます。 今回のエントリでは、機械学習プロダクトにおけるアルゴリズム開発の現場で、スクラム的な手法をとりいれたらうまく行ったよ、という話を紹介したいと思います。あくまで、「的」なので、完全にスクラムなんや、という感じではないのをご了承く... 続きを読む
MNTSQの契約書解析を支える技術|Yotaro Katayama|note
こんにちは!リーガルテックベンチャーのMNTSQの取締役をしている堅山と申します。 面接等で、そもそもリーガルテックってどんなタスクを解いているの?という疑問をいただくことが多いです。今回は、前回の記事に続き、MNTSQでどのような問題に取り組んでいるかを書こうと思います。 MNTSQでは、法律事務所向けに「法務... 続きを読む