為了保護版權,很多網路服務都會進行版權審查,來避免自己的平台成為犯罪溫床,不過,版權審查的工作量相當龐雜,通常只能交給人工智慧來處理。因此不論是 Youtube 還是 Google Drive,他們都有一套自己的審查程序,以及專為審查版權所設計的人工智慧系統。不過,最近有個負面範例讓 Google Drive 的版權檢查機制淪為笑柄,根據使用者的報告,一個內容單純得只有0或1的純文字檔案,卻讓系統誤判為違反版權條款的結果。這個狀況不但少見,也讓許多人驚訝所謂的版權檢查竟存在這種漏洞。
提供免費服務的網站有不少,但其中也不乏有人懷著不正當的心思去運用,像是利用免費空間服務分享盜版影音內容,這類的非法應用令這些網站相當棘手,為了避免自家提供的服務成為非法內容的集散地,很多網站都努力祭出限制或審核機制來防堵。比方說限制上傳檔案的大小與類型,限制服務提供的空間與類型。當然這些限制都還是會有各種方法繞過,但最後很多公司都找出了版權審核的這個方式。通常,版權審核對於影音方面的檔案比較有利,但文字或圖片方面的著作也仍有方法可以審核。
0 與 1 就能讓 Google Drive 的審核機制狼狽不堪
最近一位密西根州立大學的助理教授 Emily Dolson 博士為了準備教材,將一個名為 output04.txt 的純文字檔案放上 Google Drive。這個檔案的內容單純到了極點,只有一個字元「1」。一般來說,這樣的檔案放在任何免費空間內,理應不該被任何審核機制所刁難,畢竟「1」就是「1」,不會有其他的內容。然而,Google Drive 卻給出了該檔案違反版權相關的服務條款,因此禁止公開分享的警告。
是的,這是個內容只有一個字,甚至就是一個數字的純文字文件檔案。但既然 Google Drive 給出黃牌,那麼檔案應該就是有問題的吧(笑)。
據了解,Google Drive 的審核機制,主要是透過自動 Hash 比對機制。不過既然只有一個數字的文件檔都可以被宣告違反服務條款,那麼如果不是這個數字含有某種宇宙的奧秘,就是 Google 的審核機制竟意外出現了漏洞。而打破漏洞的竟也只是一個數字。
對此,外媒 Torrentfreak 甚至做了個實驗,除了模仿原本的案例,做出一個只有「1」的純文字文件檔上傳,得到了相同的結果,還做了一個只有「0」的檔案上傳,結果一樣收到了警告。
Google 很快的得知自家服務出現這樣的怪問題,並特地回覆 Emily Dolson 博士的推文,表示目前正在努力解決這個問題。筆者也用自己的 Google Drive 實驗了一下,顯然 Google Drive 的工程師已經快手快腳的解決了這個問題。可喜可賀,可喜可賀。