機械学習を用いると匿名のソースコードから個人を識別可能であることが判明 - GIGAZINE

(情報元のブックマーク数

ソースコードから書いた人を識別。言われてたけど、やっぱりできるらしい。

プログラミング言語を用いて書かれた「ソースコード」はあらかじめ定められた規則に従って記述する必要があり、匿名で公開されたコードから個人を識別することは困難に思えるかもしれません。ところが、実際にはコードにも個人の特徴が色濃く表れており、機械学習を用いてコードのサンプルから個人を識別できることが判明しました。

機械学習を用いると匿名のソースコードから個人を識別可能であることが判明 - GIGAZINE

また、コードサンプルは非常に長いものである必要があるわけでもなく、グリーンシュタット氏らが発表した2017年の論文(PDF)によればGitHubに公開されたほんの短いコードの断片であっても、特定の開発者とそれ以外の開発者を識別できるとのこと。加えて、すでに0と1で表される機械語コンパイルされたコードからでも、個人の識別が可能だとカルスキン氏は述べました。

機械学習を用いると匿名のソースコードから個人を識別可能であることが判明 - GIGAZINE

screenshot