価値反復に基づくアルゴリズム①
強化学習における基本知識、価値関数について成り立つ再帰的なベルマン方程式についてをまとめています。
強化学習における基本知識、価値関数について成り立つ再帰的なベルマン方程式についてをまとめています。
AI エージェントツールとして進歩が著しい、CLI 型コードエージェントについて調査してみました。
かなり今更ながらですが、gpt-oss 20b モデルをローカルで触ってみました。
Diffusers に付属する公式サンプル train_text_to_image.py を題材に、初期化処理・モデル構造・データセットの前処理・学習ループの流れを丁寧に読み解いた解説記事です。Accelerate や ZeRO3、EMA、VAE/CLIP/U-Net の役割、ノイズスケジューラによる forward/reverse diffusion の仕組みなど、テキスト条件付き拡散モデルのトレーニング全体像を把握できるよう整理しています。
1 次元畳み込みニューラルネットワーク(1DCNN)の基礎から、Conv1d/GRU/LSTM の実装ポイント、データ形状の扱い方、Kaggle「G2Net Gravitational Wave Detection」で活用された実践的な手法までをまとめた入門記事です。カーネルサイズ選択の戦略、wavegram などの特徴量生成、Conv1D×RNN の組み合わせなど、系列データモデリングの考え方を整理しています。
半教師あり学習(SSL)の主要な理論背景と、代表的な手法である pseudo-labeling・self-training・hybrid methods を体系的に整理した記事です。RGB-D 物体認識を例に、Co-training の具体的な仕組み、Pseudo-Label・Noisy Student・Meta Pseudo Labels などの進化系、MixMatch・FixMatch のような最新 SSL の流れまで幅広くまとめています。
クロスエントロピーの定義から、負の対数尤度としての導出、画像分類モデルにおける直感的理解までを整理し、PyTorch での CrossEntropyLoss の正しい使い方を実例付きで解説した記事です。softmax の扱い方や入力形式の注意点など、実装でつまずきやすいポイントもまとめています。
VAE を理解するための準備として、最尤推定とベイズ推定の違い、潜在変数モデル、EM アルゴリズム、そして変分推論(変分ベイズ)の基礎を体系的にまとめた記事です。混合ガウス分布を題材にしつつ、ELBO・KL ダイバージェンス・平均場近似など、VAE の根底にある考え方を丁寧に追いかけ、これらの概念がどのようにつながるのかを整理しています。