タグ Kaggle
人気順 10 users 50 users 100 users 500 users 1000 usersKaggleのNLPコンペで初手に使える可視化 〜BERTopicを用いた文書クラスタリングと可視化〜
BERTopic は、Transformersを用いて文書のトピックモデリングを行うためのPythonライブラリです。本記事では、自分がKaggleコンペの初手EDAによく使うコードをまとめました。 入出力のイメージ 入力: 文章のリスト (例:["I am sure some bashers of Pens fans ...", "My brother is in the market for a high-perform... 続きを読む
Kaggleで始める機械学習入門 - Qiita
機械学習を学んで何かをコードを作ってみよう、と思うときにネックになるのが学習用データと実行環境ですよね。何千件もあるデータを用意するのは大変ですし、初学者にとって高価なGPUを購入するのはハードルが高いです。 そこで機械学習のプラットフォームであるKaggleを利用し、チュートリアルでタイタニック生存者予... 続きを読む
趣味でKaggleを始めたことをきっかけにデータサイエンティストになった話 - Qiita
Kaggleアドベントカレンダー2023の19日目の記事です. TL;DR データ分析未経験からkaggleでどんなことを学んだか 想像していたデータ分析と実業務とのGap kaggleやっていて良かったこと、kaggleでは学ばなかったこと はじめに 趣味でkaggleを始めたことをきっかけに、現在はデータ分析の仕事をしています。 Muj!rush!と... 続きを読む
「面倒なことはChatGPTにやらせよう」を講談社から出版します。|カレーちゃん
以下この本の容を紹介します。 はじめにTwitterではカレーちゃんという名前で活動しております。普段はAIエンジニアとして働いており、趣味ではKaggleというデータ分析コンペティションで、「GrandMaster」という称号を獲得しております。 今年の3月にリリースされた、ChatGPTの「GPT-4」や「プログラミングが使えるAdva... 続きを読む
Kaggleで銅・銀・金メダルを取るプロセス|カレーちゃん
Kaggleで銅メダル、銀メダル、金メダルを取るプロセスの違いや、具体的に何をすべきかについて質問がありました。 Twitterで回答を募集したところ、次の回答をもらいました。 過去に似たコンペ2,3コンペ漁って1~10位までの解法に目を通しつつ、現コンペのディスカッションを全部追って効くものを試すと銀メダルは取れる... 続きを読む
Kaggleのハードルを下げたい! - Qiita
Image generated by OpenAI's DALL·E-3. はじめに こんにちは! 突然ですが、Kaggleのハードルって高くないですか?特に初見だと、複雑なルールや大量のデータなどに圧倒されてしまう人も多いかもしれませんね。また、全て英語なので非英語話者にとってはそこもハードルを上げる原因になっていると考えられます。実際は... 続きを読む
「Kaggleで勝つデータ分析の技術」から見る実用的な機械学習の知見
はじめに 機械学習に関する実用的な知見を知るために、「Kaggleで勝つデータ分析の技術」を読んだので、Kaggle以外の場面でも活用できる話題をまとめてみた。本書は機械学習の基本的な内容も含んでいるが、この記事では機会学習に関する一通りの知識を持ち、実問題に利用している読者を想定してまとめた。従って、勾配ブ... 続きを読む
高速で持続可能な開発のためのソフトウェア工学と機械学習への適用
こんにちは、Wantedlyで推薦システムを開発している樋口です。Kaggleや実務での機械学習の開発にて、過去に下記のような失敗がありました。 精度改善のために実験を繰り返し追加したら、PRが巨大になり、レビューに時間がかかった 学習結果を確認したら、パラメータを一部だけ間違えていて、再度長い実験をやり直した こ... 続きを読む
書籍「Kaggleに挑む深層学習プログラミングの極意」発売します - iwiwiの日記
共著で執筆した書籍「Kaggleに挑む深層学習プログラミングの極意」が明日(2023/2/2)発売するのでそちらの紹介です。既に書店によっては店頭に並んでいるようです。 Kaggleに挑む深層学習プログラミングの極意 (KS情報科学専門書) 作者:小嵜 耕平,秋葉 拓哉,林 孝紀,石原 祥太郎講談社Amazon https://www.kspub.co.jp/boo... 続きを読む
Kaggleや競プロのトップランカーが持つ「本質的な強み」とは。リクルートが作り出す、競技と業務の好循環 - はてなニュース
ソフトウェアエンジニアがプログラミングの腕を競い合う競技プログラミングや、データサイエンティストや機械学習エンジニアが機械学習モデルの精度を競い合うKaggle。こうしたコンペティションのトップランカーが持つテクニックやスキルを実際の業務にも活かそうとしている、あるいはすでに活かしている企業も少なくな... 続きを読む
kenken on Twitter: "完全初心者の状態で、Pythonの独学を始めて約2年🤔 約60冊の書籍を写経・消化してきたので、結構、実力がついたのかな🤔 2年間の棚卸として、僕が、写経・独学してきた書
完全初心者の状態で、Pythonの独学を始めて約2年🤔 約60冊の書籍を写経・消化してきたので、結構、実力がついたのかな🤔 2年間の棚卸として、僕が、写経・独学してきた書籍とKaggleの取り組みを紹介したいと思います☺️ 全… https://t.co/KL7fSg0cyl 続きを読む
Kaggleで金融コンペを開催するための(僕が知っている)すべて
はじめに 先週からマケデコというMarket APIのDeveloper Communityの運営をスタートしており、その中で我々が問題設計を担当した以下のKaggleコンペにおいて どのような問題設計と実際にどうやって解いてみたのか? という質問を頂きました。。この記事では、そのあたりについてKaggleで金融コンペを開催するための(僕が... 続きを読む
Kaggleで使用される敵対学習方法AWPの論文解説と実装解説 ~Adversarial Weight Perturbation Helps Robust Generalization~
Kaggleで使用される敵対学習方法AWPの論文解説と実装解説 ~Adversarial Weight Perturbation Helps Robust Generalization~ 本資料では、AWPという学習手法について、元論文と実装の解説を行っている。 AWPはモデルに敵対的な摂動を加えながら学習するという手法で、汎化能力が高まることからKaggleで人気の手法となって... 続きを読む
元iOSエンジニアの自分が、我妻先生の「みんなのKaggle講座」のPython基礎で特に学びになったことをまとめてみた - Qiita
Udemyの我妻先生の「みんなのKaggle講座」 を受講させていただきました。 大変わかりやすかったので、Kaggleに取り組んでみたいと思われているみなさんにおすすめです。この記事を見て、少しでも気になった方はぜひ購入してみてください。 自分は元iOSエンジニアということもあり、Pythonの書き方がなれていなかったので... 続きを読む
H&Mコンペで銀メダルを獲得したソリューション - ANDPAD Tech Blog
アンドパッドのデータ基盤チームに所属している成松です。 先日までkaggleで開催されていたH&M Personalized Fashion Recommendationsにて、私が参加したチームが2,952チーム中22位で銀メダルを獲得しました! そこで、本記事ではH&Mコンペの簡単な概要説明と私個人のSolution(Private 36位相当)について紹介します。 ... 続きを読む
Kaggleで得られるのは“技術領域の深化”と“専門分野の拡張” DeNAのKaggle Grandmasterたちが語る、AIエンジニアとしての生存戦略
コモディティ化するKaggleのTier 差別化のポイントは? 大久保渉太氏(以下、大久保):では次の質問に行きます。「昨今、特に日本においてKaggleのTierは、コモディティ化しつつあるように見えます。これについてどう思われますか? そこで大切になる、Tierだけでは表せない差別化ポイントは何だと思いますか?」。こ... 続きを読む
遅くないpandasの書き方 - ML_BearのKaggleな日常
これは何? この記事は Kaggle Advent Calendar 2021 の7日目の記事です。 pandasはデータ分析ライブラリとして非常に便利ですが、書き方を間違えると簡単に処理が遅くなってしまうという欠点があります。そこで、この記事では遅くならない書き方をするために気をつけたいポイントをいくつかご紹介したいと思います。 こ... 続きを読む
Kaggle Grandmasterへの道 ~ データサイエンティスト“最高峰”を目指す
2021年度リクルート入社の2人のKaggle Grandmasterにインタビュー。Kaggle Grandmasterを目指すために意識しておくべきポイントや戦略について解説する。これを読んで、データサイエンティストとして“最高峰”の称号を目指そう。 連載目次 この連載では、近年話題のコンペティションプラットフォーム「Kaggle」について、... 続きを読む
脱・Kaggle初心者 ~ 一歩先に行くためのノウハウ:Kaggle入門 - @IT
連載目次 導入 この連載では、近年話題のコンペティションプラットフォーム「Kaggle」について、リクルート所属のKaggle Master 4人がKaggleの仕組みや取り組み方、初心者から一歩先に行くためのノウハウについて解説を行います。 第1回では、これからKaggleを始めようと思っている方向けに、Kaggleの仕組みや実際にコン... 続きを読む
仕事も友達もKaggleで得た―。敏腕データサイエンティストが熱中する、分析で「競う」世界
仕事=Kaggle=趣味。脳医学、生物学など他分野の専門家と予測モデルを作り続ける、“コンペ漬け”の日々 ――2020年3月から在籍するNVIDIAでは、業務時間のほとんどをKaggleに費やしているそうですね。 小野寺:はい。9割超の時間はKaggleをやっています。完全に趣味が仕事になった感じですね。最初にNVIDIAに声をかけても... 続きを読む
学生だけど正社員!Kaggler&競プロerの23歳アルゴリズムエンジニアにインタビュー | 株式会社AppBrew
こんにちは、AppBrew(アップブリュー)の阿部です。 今回インタビューでご紹介するのはProductGrowthチームでアルゴリズムエンジニアを務める平尾 礼央(ひらお れお)。 平尾は高専を卒業後、首都大学東京システムデザイン学部情報通信システムコースに編入。大学で自然言語処理を学ぶ傍ら、Kaggleの機械学習コンペで... 続きを読む
Kaggleで勝ちっぱなしのデータサイエンティストに話を聞いてみた | AI専門ニュースメディア AINOW
著者のParul Pandey氏は世界各地に拠点のあるAIスタートアップH2O.aiでデータサイエンス・エバンジェリストを務めており、AINOW翻訳記事『あなたのビジネスにAI戦略を効果的に使用する方法』の著者でもあります。同氏が最近Mediumに投稿した記事では、H2O.aiに所属するKaggleグランドマスターにKaggleの取り組み方に関し... 続きを読む
Kaggle で10年遊んだ GrandMaster の振り返り
2021-02-18 2011年2月16日に Kaggle アカウントを取得して10年が経過した。長い間 Kaggle Ranking 世界 1 位を目指してきたが、この目標やモチベーションが大きく変化してきたと感じたため、一区切りつけるためにもこの10年+αを振り返る。今の目標は対象を問わずアルゴリズムで資産を最大化すること。データとエンジニア... 続きを読む
KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ | GMOインターネット 次世代システム研究室
2020.10.05 KaggleOpsを考える ~ MLflow + Colaboratory + Kaggle Notebook ~ こんにちは。次世代システム研究室のY. O.です。 筆者はデータ分析のスキルアップのためにkaggleというデータ分析プラットフォームを活用しています。kaggleを始めてから約2年間を経て、スキルアップの枠を超え、趣味・生活の一部・etc.にな... 続きを読む
Kaggle Riiid! コンペ参戦記 - ML_BearのKaggleな日常
これは何? '20/10-'21/01にKaggleで開催されていた Riiid! Answer Correctness Predictionの参加記録です public 51st (0.801) → private 52nd (0.802) と順位は奮いませんでしたが、現実世界での予測タスクに即したコンペの設計(後述)や、1億行を超える豊富なデータを扱えるといった内容が非常に勉強になるコンペでし... 続きを読む