てがみ: qatacri at protonmail.com | 統計 | ⟨ 2022 ⟩
: qatacri at protonmail.com |
|
⟨ 2022 ⟩
ランダムなデータ間のコサイン類似度 x の確率密度分布は p(x) = -(1/π) arccos'(x) であって、 0 付近の確率が一番低い。一瞬直感に反するような気がしなくもない。…と書いていて気づいたが、これが正しいのは 2 次元の場合だけか。むしろ d → ∞ で δ(x) になる気がする。恥ずかしい間違いだが、このページでは間違いを消さないというポリシーがある。ぐぬぬ。
x
p(x) = -(1/π) arccos'(x)
d → ∞
δ(x)