Ventana分散式計算建立註冊內容的搜尋引擎

買賣虛擬貨幣


由於網際網路的客戶-端伺服器架構,追蹤線上數字內容的動態是一個巨大挑戰;檔案存貯在不透明的遠端伺服器上,我們必須瀏覽、下載和檢視檔案的內容來了解特定的數字內容是否存在。而且,數字檔案可以被輕易地並且經常地重新發布到不受控的未被授權的網站伺服器上(數字盜版)。檔名可以被輕易更改,檔案可以被壓縮,影片音訊檔案可以被減取樣,或用其他方式轉換,仍然可供人們觀看欣賞。


由於這樣的客戶端-伺服器架構,遙測數字檔案 (狀態資訊從遠端配置的裝置送回到中央伺服器) 實際上是不可能的。 檔案遙測需要遠端裝置配合安裝額外的軟體,傳送它的所有數字內容的相關資訊。並沒有特別的激勵機制讓遠端伺服器的主人來發布準確的數字內容目錄。


基於的加密貨幣可以激勵龐大網路的計算裝置進行所謂工作量證明(proofs-of- work)[1]的計算工作。 在影片內容普遍被盜版的現實情況下 (比如在油管(YouTube)和臉書(Facebook)之間盜用), 本文探討一種激勵機制下的對用現代隱碼技術做標記的數字創意內容進行分散式搜尋的技術可行性。它也包括透過分散式的計算機網路(而不是一個專門的中央伺服器叢集) 下載和處理互聯上的數字內容,來發現盜版內容在互聯上的分佈情況。我們目前主要解決影片(包含音訊)內容的盜版問題。


問題陳述

影片盜版對於大的電影工作室和小的內容創造者來說都是巨大的附加成本。數項研究發現,僅對美國電影業,這項成本就達 200 億美元 。
2016 年,臉書(Facebook)產生了超過 300 億美元的營業收入,但該社交網路上的 73%的最受歡迎影片 是從 YouTube 上盜版而來的。這通常被稱為 "Freebooting"。
目前,為了讓 Facebook 移除內容創作者的被盜內容,內容創作者必須:1. 首先被通知他們的原創內容被盜並重新上載到臉書(Facebook)了,然後  2. 完成一個冗長的線上表單,並且上傳原版內容到臉書(Facebook)來證明他們的版權。
雖然油管-臉書(YouTube-Facebook)之間的互相盜版是這個問題的備受矚目的例項(具有諷刺意味的是,最近一個討論盜版問題的 YouTube 影片在 Facebook 上獲得了更多的觀看,但它並不是唯一的例子 。一個消除這種低效率的解決方案將會大幅度減少線上影片內容的收入損失,為消費者帶來更高質量的內容和更低的價格。


集中式的計算和分散式的計算

單個實體要在浩瀚網路上搜尋特定視(音)頻內容需要手工複審無數檔案。以 Facebook 為例,每天大約 1 Petabyte (1024 Terabytes)的資料會增加到它的伺服器叢集上,其中大約1/3 是影片資料。 為了驗證這些影片的版權,這大約 3000 TB 的新影片資料需要每天被下載複審。使用中心化的雲服務,像亞馬遜雲服務(AWS),這樣的分析需要大約 10 萬美元一天。


解決方案概述

用分散式網路上被激勵的計算節點進行內容下載和複審的技術可行性。本系統依賴於對數字檔案的隱碼預處理(水印)和公開區塊鏈上的所有權註冊。對可疑的提供有版權內容的搜尋空間(某地理區域部署的一系列內容伺服器)進行內容搜尋、下載和複審將會提供何時何地內容被(合法地和非法地)釋出的輪廓。我們的系統由以下兩個關鍵階段定義:
1. 內容編碼和註冊: 第一個階段,內容在中心化的伺服器上用一個唯一標識編碼。然後我們在公開(比如以太坊 Ethereum)上記錄內容版權所有者對該內容(由唯一標識確定)的所有權,再將內容釋出到指定目標。
2. 內容搜尋和報告: 我們假設非常可能發生一些盜版事件。我們用一組被激勵的計算節點搜尋、下載並複審一定數量的可疑影片檔案,把結果報告給這項服務的購買者。這個階段部分是中心化的,部分是分散式的。

我們關於網際網路上可用的計算和頻寬資源的邊際成本做了一些假設,提出一個利用它們建立註冊內容的搜尋引擎的可行方案。我們受到以太坊(Ethereum)的啟發,描述一種激
勵機制來保證計算結果有很高的可靠性。
隨著分散式技術生態系統的成熟完善,最終有可能讓目前中心化的操作完全以分散式的方式進行。我們把這種可能性留給將來的工作。


 團隊

更多資訊

免責聲明:

  1. 本文版權歸原作者所有,僅代表作者本人觀點,不代表鏈報觀點或立場。
  2. 如發現文章、圖片等侵權行爲,侵權責任將由作者本人承擔。
  3. 鏈報僅提供相關項目信息,不構成任何投資建議

推荐阅读

;