てがみ: qatacri at protonmail.com | 統計 | 2022

202229700

ランダムなデータ間のコサイン類似度 x の確率密度分布は p(x) = -(1/π) arccos'(x) であって、 0 付近の確率が一番低い。一瞬直感に反するような気がしなくもない。…と書いていて気づいたが、これが正しいのは 2 次元の場合だけか。むしろ d → ∞δ(x) になる気がする。恥ずかしい間違いだが、このページでは間違いを消さないというポリシーがある。ぐぬぬ。