てがみ: qatacri at protonmail.com | 統計 | ⟨ 2022 ⟩
: qatacri at protonmail.com |
|
⟨ 2022 ⟩
仮に人力で画像のキャプションを 1k 次元のフラットなベクトル空間にマップするとしたら、どんな構造になるか。単語くらいの粒度の embedding は使っていいとして、「3 つくらいの対象物、その対象物の性質、対象物間の関係」を並べればまあまあ用は足す気がする。