kabupen.com
Home Blog Devs About
GitHub kabupen ロゴ
  • 2025/11/30

    Sarsa による行動価値関数の学習 ー ベルマン方程式から TD 誤差まで

    行動価値関数のベルマン方程式を期待値の形で捉え直し、TD誤差の導入から Sarsa による on-policy な価値学習までを丁寧に解説します。

    • 強化学習
    • # Sarsa
    • # TD学習
    • # 価値ベース
    • # ベルマン方程式
  • 2025/11/29

    条件つき期待値と期待値の繰り返しの公式をちゃんと理解する

    条件つき期待値 E[Y|X] の定義から始めて、連続分布を前提に全期待値の法則 E[E[Y|X]]=E[Y] を積分計算で丁寧に導出し、その直感的な意味や強化学習・ベイズ統計での使い所にも触れます。

    • 統計
    • # 条件つき期待値
    • # 期待値の繰り返しの公式
  • 2025/11/26

    ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning Engineering

    今回は ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning Engineering を読んでみました。

    • 強化学習
    • # 論文
  • 2025/11/25

    価値反復に基づくアルゴリズム①

    強化学習における基本知識、価値関数について成り立つ再帰的なベルマン方程式についてをまとめています。

    • 機械学習
    • # 強化学習
    • # ベルマン方程式
  • 2025/11/23

    Codex CLI について

    AI エージェントツールとして進歩が著しい、CLI 型コードエージェントについて調査してみました。

    • 機械学習
    • # codex
  • 2025/11/21

    ollama で gpt-oss:20b を動かしてみよう

    かなり今更ながらですが、gpt-oss 20b モデルをローカルで触ってみました。

    • 機械学習
    • # ollama
    • # Jetson
    • # gpt-oss
  • 2025/11/18

    テイラー展開について

    関数の近似でよく使用されるテイラー展開について、定義から自分がこれまでにハマった観点をまとめています。

    • 物理数学
    • # テイラー展開
  • 2025/07/06

    確率密度関数の変数変換入門

    一変量の置換積分から出発し、確率変数の変数変換を一対一対応・単調性の観点から整理します。さらに、多変量への拡張としてヤコビアンがどのように微小体積を「拡大・縮小」する係数になるのか、微分の向き・並べ方の覚え方まで含めて解説します。

    • 統計
    • # 変数変換
    • # ヤコビアン
  • 2024/12/24

    Diffusers のサンプルプログラムを読み解いてみた

    Diffusers に付属する公式サンプル train_text_to_image.py を題材に、初期化処理・モデル構造・データセットの前処理・学習ループの流れを丁寧に読み解いた解説記事です。Accelerate や ZeRO3、EMA、VAE/CLIP/U-Net の役割、ノイズスケジューラによる forward/reverse diffusion の仕組みなど、テキスト条件付き拡散モデルのトレーニング全体像を把握できるよう整理しています。

    • 機械学習
    • # diffusers
  • 2024/10/21

    統計に関する計算テクニックなど

    統計検定勉強中に出会った計算テクニックを雑多にまとめます。

    • 統計
  • 2024/10/16

    マルコフの不等式とチェビシェフの不等式の基礎

    期待値や分散の情報だけから、確率変数が大きく外れた値をとる確率に上限を与える「マルコフの不等式」「チェビシェフの不等式」について、証明の流れと直感的な意味をまとめます。定義関数を用いた基本的な導出から、現実的なイメージにつながる例まで整理した記事です。

    • 統計
    • # マルコフの不等式
    • # チェビシェフの不等式
  • 2024/10/10

    標本平均と標本分散

    正規母集団から得られる標本平均と不偏分散がどのような分布に従うのかを整理し、そこから t 分布および F 分布がどのように導かれるかを体系的にまとめます。正規分布の再生性・カイ二乗分布・t 分布・F 分布の関係を、式変形の流れとともに理解します。

    • 統計
    • # 標本平均
    • # 標本分散
  • 2024/10/09

    畳み込みと混合分布

    畳み込みと混合分布という、一見似ていて混同しがちな二つの概念を対比しながら整理します。確率変数の和の分布を求める畳み込みと、確率密度関数そのものを重ね合わせて表現する混合分布では何が違うのか、直感的理解から数式による導出までまとめます。

    • 統計
  • 2024/10/05

    超幾何分布について

    超幾何分布の定義と、その確率の総和が 1 になることの証明をまとめます。二項展開を用いた少し巧妙な導出手法を中心に、なぜその流れで証明できるのかを直感とともに整理した解説記事です。

    • 統計
    • # 超幾何分布
  • 2024/10/01

    ワルド検定

    ワルド検定の基本的な考え方と、その背後にある最尤推定量の漸近正規性について解説します。尤度比検定との対比や、検定統計量がどのように導かれるかを式とともに丁寧に整理し、ワルド型検定の利点・背景となる理論を解説します。

    • 統計
    • # ワルド検定
  • 2024/07/10

    不偏推定量について

    母平均・母分散と、実際のデータから求める標本平均・標本分散の違いを整理し、それぞれの定義と役割を丁寧にまとめます。「平均」「分散」という用語が文脈によって指す対象が異なる点や、母数・統計量といった基本概念の位置づけを明確にする入門的な解説記事です。

    • 統計
  • 2024/06/29

    不偏分散の導出と意味

    標本平均・標本分散の期待値を実際に計算しながら、不偏推定量の定義と「不偏分散はなぜ n−1 で割るのか」を丁寧に導出します。標本分散との違い、用語整理、推定量としての性質までを体系的に整理した記事です。

    • 統計
    • # 不偏分散
  • 2024/06/15

    ガンマ関数・ガンマ分布・カイ二乗について

    ガンマ関数の基本から始め、ガンマ分布の定義・性質・利用例、さらにその特殊形として位置づけられるカイ二乗分布との関係までを整理します。

    • 統計
  • 2024/05/11

    確率変数の和の分布

    確率変数の変数変換を重積分の視点から体系的に整理し、ヤコビアンを用いて新しい確率密度関数を導く方法を解説します。応用として、確率変数の和の分布を求める畳み込みの背景にある考え方をまとめます。

    • 統計
  • 2024/04/14

    Hello World! on Android

    MediaPipe の公式チュートリアル「Hello World! on Android」を、Bazel ではなく Gradle を用いて Android Studio 上で実行する手順をまとめます。スタイル設定、外部ライブラリ導入(MediaPipe の Version Catalog 設定)、CameraX の利用などの解説です。

    • Android
1 / 2 次のページ

カテゴリー

  • Android (1)
  • Kaggle (1)
  • 機械学習 (10)
  • 強化学習 (2)
  • 情報収集 (1)
  • 統計 (13)
  • 物理数学 (1)

タグ

  • # ベルマン方程式 (2)
  • # VAE (2)
  • # Sarsa (1)
  • # TD学習 (1)
  • # 価値ベース (1)
  • # 条件つき期待値 (1)
  • # 期待値の繰り返しの公式 (1)
  • # 論文 (1)
  • # 強化学習 (1)
  • # codex (1)
  • # ollama (1)
  • # Jetson (1)
  • # gpt-oss (1)
  • # テイラー展開 (1)
  • # 変数変換 (1)
  • # ヤコビアン (1)
  • # diffusers (1)
  • # マルコフの不等式 (1)
  • # チェビシェフの不等式 (1)
  • # 標本平均 (1)
  • # 標本分散 (1)
  • # 超幾何分布 (1)
  • # ワルド検定 (1)
  • # 不偏分散 (1)
  • # CNN (1)
  • # 半教師あり学習 (1)
  • # SSL (1)
  • # フーリエ解析 (1)
  • # 波形データ (1)
  • # クロスエントロピー (1)
  • # 平均場近似 (1)
  • # KLダイバージェンス (1)
  • # ベイズ推論 (1)

月別アーカイブ

  • 2025年 (8)
    • 11月 (7)
    • 7月 (1)
  • 2024年 (22)
    • 12月 (1)
    • 10月 (6)
    • 7月 (1)
    • 6月 (2)
    • 5月 (1)
    • 4月 (1)
    • 3月 (6)
    • 2月 (4)
© 2025 Copyright kabupen All rights reserved.