2013年5月,金加里在美國頂級政治學(xué)刊物《美國政治學(xué)評論》(American Political Science Review)上發(fā)表了一篇合作文章,通過海量數(shù)據(jù)收集和量化研究,試圖解讀中國網(wǎng)絡(luò)審查制度的運(yùn)行機(jī)制和背后邏輯。他的研究團(tuán)隊(duì)首先通過閱讀以前的文獻(xiàn)和咨詢相關(guān)專家劃分出85個(gè)話題,并相應(yīng)設(shè)置出一系列關(guān)鍵詞,通過計(jì)算機(jī)技術(shù)以六個(gè)月為時(shí)段,根據(jù)這些關(guān)鍵詞從1382個(gè)中國網(wǎng)站收集了360余萬個(gè)博客帖子,并從中隨機(jī)抽樣了超過12萬條進(jìn)行分類分析。這一過程隨后重復(fù)了幾次,他們一共收集并分析了1100余萬個(gè)博客帖子。如此的大樣本分析在針對中國互聯(lián)網(wǎng)的研究中并不多見,且出自名家之手,故文章一出,引起不少討論。在這篇文章初成但尚未發(fā)表之時(shí),金加里在哈佛舉辦了一次小規(guī)模講座介紹研究成果。盡管他本人并非中國問題專家,但筆者在會場見到了諸多中國研究大腕。
Courtesy of Gary King
哈佛大學(xué)政治學(xué)系教授金加里
此文的主要結(jié)論是,中國的網(wǎng)絡(luò)審查者嚴(yán)格審查集體性行動(dòng)(collective action)而非批評性言論。同一研究團(tuán)隊(duì)在這篇文章發(fā)表之后還進(jìn)行了一個(gè)跟進(jìn)研究,涵蓋了此前并未納入其中的微博,并且開通一些社交媒體賬戶發(fā)布一些帖子,對中國的網(wǎng)絡(luò)審查機(jī)制進(jìn)行主動(dòng)性測試,得出的結(jié)論基本未變。文章也對中國的網(wǎng)絡(luò)審查制度的運(yùn)作過程做出了一定的解釋,并回答了為什么中國的網(wǎng)絡(luò)審查者們總是能夠非常高效、準(zhǔn)確地對海量信息進(jìn)行審查,并快速作出是否刪除的決定。盡管近年來關(guān)于互聯(lián)網(wǎng),特別是社交媒體對于中國社會和政治的發(fā)展有諸多討論,但能通過大數(shù)據(jù)證實(shí)或者證偽一些泛泛之論,這不僅符合美國社會科學(xué)一直以來力圖“科學(xué)化”的大方向,對于中國研究和深入理解中國的變化也是極有意義的嘗試。
本采訪于9月17日于金加里在哈佛大學(xué)政治學(xué)系的辦公室以英文進(jìn)行,并于10月8日進(jìn)行了補(bǔ)充采訪。訪談部分在發(fā)表前經(jīng)金加里核對。
中國網(wǎng)絡(luò)審查更關(guān)注集體性行動(dòng)
問:你是如何想到要對中國的互聯(lián)網(wǎng)審查制度作一個(gè)大規(guī)模量化研究的?
答:事實(shí)上我們一開始是對一個(gè)完全不同的東西感興趣。我們感興趣的是如何用大數(shù)據(jù)方法來分析文本。現(xiàn)在有越來越多的數(shù)據(jù)可供分析,比如說社交媒體和電子郵件等。如果我們能夠創(chuàng)建一些方法分析這些數(shù)據(jù),那么會非常有價(jià)值。我們創(chuàng)建了一些方法,但是我們覺得還需要找一些“困難的案例”來測試這些方法是否適用。所以我們決定轉(zhuǎn)換語言,比如說用中文來測試我們的方法。所以我們使用了我聯(lián)合創(chuàng)辦的公司,Crimson Hexagon,通過其中文社交媒體的數(shù)據(jù)庫來進(jìn)行分析。這個(gè)數(shù)據(jù)庫基本上就是摘取中文社交媒體上帖子的Url(網(wǎng)頁地址),并對其進(jìn)行分析。我們的方法運(yùn)行良好。后來我和我的同事們決定再次訪問這些帖子,因?yàn)槲覀兿肓私庖幌逻@些帖子的上下文。但是我們點(diǎn)擊這些Url的時(shí)候,發(fā)現(xiàn)有一些帖子已經(jīng)不在了。一開始我們以為是Crimson Hexagon出錯(cuò)了,但是后來我們才發(fā)現(xiàn),原來是我們在中國政府閱讀并刪除這些帖子之前,就已經(jīng)把它們搜集到數(shù)據(jù)庫了。這樣我們就擁有了很多被中國政府審查刪除導(dǎo)致中國網(wǎng)民無法閱讀的帖子。所以我們改變了我們的研究題目。
問:在你們進(jìn)行這項(xiàng)研究的時(shí)候,微博在中國的活躍度甚至超過了博客,但是為什么你們的研究沒有涵蓋微博?
答:我們一開始研究博客是因?yàn)槲覀冇X得博客可以給中國網(wǎng)民更多的時(shí)間去表達(dá)他們自己。在我們進(jìn)行的最新的一項(xiàng)研究中,我們已經(jīng)將微博納入我們的研究。我們發(fā)現(xiàn)審查機(jī)制的運(yùn)行原則是一樣的。
問:你是如何在研究中定義“集體性行動(dòng)”?
答:由非政府發(fā)起的任何可能動(dòng)員人們或者導(dǎo)致聚集的行為。比如說,你決定鼓動(dòng)人們上街游行示威,這就是集體性行動(dòng)。如果你邀請很多人參加一次聚會活動(dòng),這也是集體性行動(dòng)。如果你決定邀請很多人聚集在一起慶祝地方政府官員的偉大功績,這也是集體性行動(dòng)。
問:但是在現(xiàn)實(shí)中有一些是很難被清晰定義的。比如說你的研究中將“艾未未”這個(gè)詞條作為“集體性行動(dòng)”,可是在現(xiàn)實(shí)中我們也可以把這個(gè)詞條歸入“對政府進(jìn)行批評”這個(gè)項(xiàng)目中。
答:在現(xiàn)實(shí)的審查中,你無法只閱讀一個(gè)帖子,然后就決定它是不是集體性行動(dòng),因?yàn)槟銕缀蹩梢园阉惺虑槎己驼蜗嚓P(guān)聯(lián),比如從對政權(quán)的攻擊到談?wù)撘徊侩娪。所以如果在這個(gè)基礎(chǔ)上對個(gè)案進(jìn)行歸類的話,肯定是行不通的。在現(xiàn)實(shí)中,中國的審查者們好像是首先觀察社交媒體上人們的交流,當(dāng)有圍繞某一個(gè)話題的討論一下子變得特別活躍的時(shí)候,他們就開始審查這些討論,如果這些討論是關(guān)于某個(gè)具體的集體性行動(dòng),或者是某一個(gè)曾經(jīng)在過去組織過集體性行動(dòng)的人發(fā)起的,他們就會將相關(guān)的討論進(jìn)行刪除。他們會刪除與這個(gè)討論相關(guān)的所有內(nèi)容,無論這些討論是贊成政府還是批評政府。
問:你在論文中還提到所有的帖子按照話題性質(zhì)被分成了五類:集體性行動(dòng)、批評審查員、色情、政府政策和其他新聞。但這是否會存在預(yù)設(shè)立場的問題?比如一些詞條性質(zhì)比較模糊,但相關(guān)新聞事件在你進(jìn)行深入分析的時(shí)候已經(jīng)發(fā)生過了,這就可能會導(dǎo)致一個(gè)“事后歸因”的錯(cuò)誤。
答:我們實(shí)際上是通過反向操作的辦法來還原中國政府的審查過程,所以這項(xiàng)研究從設(shè)計(jì)上來說,就是一個(gè)事后性質(zhì)的研究。但是我們找了兩個(gè)了解中國政治的人來對這些帖子進(jìn)行歸類,他們的工作是各自獨(dú)立進(jìn)行的。他們的分類結(jié)果高度一致,只有在一個(gè)事件的分類上出現(xiàn)了分歧,即方濱興被投擲雞蛋和鞋子。這個(gè)事件既包含了對審查者的批評,也包含了集體性行動(dòng)。此外,我們還用一些樣本之外的案例對這個(gè)分類進(jìn)行測試,這就并不是回溯性的,而是預(yù)測性的。我們得到的結(jié)果都是相同的。
多樣化且高效的審查機(jī)制
問:中國的網(wǎng)絡(luò)審查者嚴(yán)格審查集體性行動(dòng)而非批評性言論,這個(gè)結(jié)論是否出乎你的意料?
答:是的,我們非常吃驚。因?yàn)榇饲昂芏嗳硕颊J(rèn)為中國的網(wǎng)絡(luò)審查者們是審查各種批評性的內(nèi)容的,當(dāng)然也是會審查集體性行動(dòng)的。但是我們現(xiàn)在發(fā)現(xiàn)現(xiàn)實(shí)并不完全是這樣的,一些對政府批評性的帖子是沒有被刪除的。我們發(fā)現(xiàn)很多很多對政府進(jìn)行激烈批評的帖子,甚至是涉及一些政治領(lǐng)導(dǎo)人個(gè)人的都沒有被刪除,而且這種情況非常普遍。這很令我們吃驚。
但是如果你仔細(xì)想想,這也不奇怪。政府允許這些批評性的帖子存在下去,他們能夠得到什么?中央政府可以借此對地方政府進(jìn)行監(jiān)督,可以對地方領(lǐng)導(dǎo)人的表現(xiàn)進(jìn)行評估,他們也可以根據(jù)這些批評來替換一些地方領(lǐng)導(dǎo)人,如果這些信息都被刪了,中央領(lǐng)導(dǎo)人也就看不到了。
問:但是允許這些批評存在,是否也是對政權(quán)的一種風(fēng)險(xiǎn)呢?
答:有多少風(fēng)險(xiǎn)?如果僅僅是人們對政府的評價(jià)很差,這個(gè)恐怕并不是特別大的風(fēng)險(xiǎn)。只有當(dāng)人們開始行動(dòng)的時(shí)候,這才會真正影響到他們對權(quán)力的控制。比如我們在阿拉伯之春中看到的,當(dāng)人們走上街頭的時(shí)候,一個(gè)政權(quán)可能真的就會崩潰了。進(jìn)一步來說,如果你在一個(gè)網(wǎng)絡(luò)被審查的國家里上網(wǎng),結(jié)果發(fā)現(xiàn)網(wǎng)上全都是關(guān)于這個(gè)政府的正面言論,那么你會對這個(gè)政府因此有更正面的感受嗎?
問:但是在中國,由于敏感詞的存在,很多批評性的帖子根本就發(fā)不出來,或者人們自己就不發(fā)表這樣的意見,這也可能導(dǎo)致你所統(tǒng)計(jì)到的實(shí)際發(fā)表出來的批評性的言論激烈程度很弱,以致于政府沒有必要?jiǎng)h除它們。有這個(gè)可能嗎?
答:我們在第二篇論文里面對這個(gè)可能性進(jìn)行了研究。在第一篇論文中,我們僅僅涵蓋了相對較短的一個(gè)時(shí)段內(nèi)的帖子,所以你是對的,完全有可能人們在提交了帖子之后,審查者可能根本就不讓這個(gè)帖子發(fā)表出來。如果是這樣的話,我們的第一篇論文所使用的研究方法就無法發(fā)現(xiàn)這個(gè)問題。所以在第二篇論文中,我們自己開通了一些社交媒體賬號,并根據(jù)已有的社交媒體上的內(nèi)容發(fā)表一些帖子,這樣我們就能知道是否這些帖子在發(fā)表之前就被審查了。現(xiàn)在我們發(fā)現(xiàn),中國網(wǎng)絡(luò)審查者確實(shí)運(yùn)用關(guān)鍵詞進(jìn)行事前審查,但是這個(gè)事前審查的過程非常低效,那些他們認(rèn)為不正確的帖子并沒有被有效地提前發(fā)現(xiàn)。
問:通過你的研究,我們對于中國的網(wǎng)絡(luò)審查制度的運(yùn)作過程有什么了解呢?
答:通過我們第二篇論文的研究,我們對中國的審查制度運(yùn)作有了更進(jìn)一步的了解。我們發(fā)現(xiàn)了很大的多樣性,在不同的網(wǎng)站,他們適用的技術(shù)和審查流程是不一樣的。在中國,很多審查都是由網(wǎng)絡(luò)公司自己完成的,而且看上去政府好像也是允許不同的網(wǎng)站保持各自在審查上的多樣性,只要他們能夠達(dá)到政府要求的結(jié)果就行。
中國的網(wǎng)絡(luò)審查分成兩個(gè)階段,第一階段是核查階段,這是自動(dòng)完成的。第二階段是作出是否刪帖的決定,這是由人工完成的。在第一個(gè)階段有很多多樣性,有一些網(wǎng)站的核查內(nèi)容非常多,有一些非常少,但基本上它們最終的審查結(jié)果是大致一樣的。
而且這種審查是非常高效的,基本上是在當(dāng)天之內(nèi),任何帖子都會被核查,然后有一些會被刪除。我覺得他們?nèi)绱烁咝且驗(yàn)樗麄冊诒O(jiān)測都有什么話題或者帖子突然變得非常熱門,就像我剛才講的。他們并不需要特別仔細(xì)地閱讀每一個(gè)帖子然后去分析他們的內(nèi)容到底是正面的還是負(fù)面的,只要有特別熱門的帖子,他們就會特別關(guān)注,然后根據(jù)這個(gè)話題是否在討論群體性行動(dòng)來決定是否刪除。如果有一萬個(gè)人都在談?wù)撘粋(gè)話題,我覺得對審查者來說不難發(fā)現(xiàn)這個(gè)討論。
問:根據(jù)你的理解,中國的網(wǎng)絡(luò)審查指令是非常具體的?
答:我們并不知道,我們不知道誰發(fā)布審查指令,或是發(fā)給誰。我甚至也不敢肯定審查指令就是像我剛才猜測的那樣。但是有一點(diǎn)是肯定的,就是要審查和刪除批評性的帖子非常麻煩,因?yàn)檫@是無法自動(dòng)完成的,你必須要閱讀每一個(gè)帖子,然后才能做出決定。
社交媒體扮演怎樣的角色取決于人
問:你覺得社交媒體在中國是否真的對集體性行動(dòng)有促進(jìn)作用?
答:這是非常有趣的問題。社交媒體當(dāng)然使得人們的交流更加便利,如果沒有被刪除,也會使得集體性行動(dòng)變得更加有可能。我最近在芝加哥,美國歌星Justin Timberlake發(fā)了一個(gè)Twitter說他會在當(dāng)?shù)氐囊粋(gè)俱樂部,前150個(gè)到這個(gè)俱樂部來的人會得到免費(fèi)的門票,結(jié)果有一千多人去了。他具備了動(dòng)員人們的能力,當(dāng)然對他來說動(dòng)員人們來聽音樂會與政治并不相關(guān),但是其他的人擁有相同動(dòng)員能力的話,可能就是與政治相關(guān)了。政府當(dāng)然不愿意出現(xiàn)這樣的權(quán)力擁有者。
問:你認(rèn)為政府的這種審查制度是否有效地阻止了中國的集體性行動(dòng)呢?
答:當(dāng)然中國仍然有很多示威游行,但是我覺得這種審查確實(shí)有效地阻止了集體性行動(dòng)。比如說在離你三個(gè)街區(qū)遠(yuǎn)的地方有游行,但是你不知道,那你怎么能夠參與呢?
問:從另一個(gè)角度來說,我們可以從你的研究中了解到中國網(wǎng)民的什么特點(diǎn)?
答:中國有著一個(gè)鄙視審查制度的網(wǎng)民群體,他們對任何你所能想象得到的話題感興趣,并且持有極為多樣化的觀點(diǎn)。自動(dòng)的審查方式對于中國人來說似乎并不是個(gè)問題,他們可以很容易繞過去。比如關(guān)鍵詞審查,他們有很多方法來繞過這個(gè)東西。所以所謂的自動(dòng)審查制度只是在浪費(fèi)時(shí)間和金錢。我們發(fā)現(xiàn)大多數(shù)商業(yè)網(wǎng)站并不使用自動(dòng)審查的方式,而政府網(wǎng)站使用這種方法。
問:你剛才提到了“阿拉伯之春”,你認(rèn)為社交媒體也能在中國扮演同樣的角色嗎?
答:并不是社交媒體在扮演那樣的角色,而是人民。所以問題是中國人民是否愿意扮演這樣的角色。這個(gè)問題應(yīng)該由你來回答。
問:你說的有道理,但是在埃及的解放廣場上,人們拿著手機(jī)發(fā)Twitter或者是Facebook。人們也需要工具。
答:人們會用各種工具和手段來實(shí)現(xiàn)自己的目標(biāo)。所以我覺得即便是沒有Twitter或者Facebook,埃及人也會做同樣的事情,他們甚至可能會通過油印小報(bào)。這是不同的時(shí)代,人們使用不同的科技。當(dāng)然中國人目前無法使用這種社交科技來實(shí)現(xiàn)這樣的目的,因?yàn)橹袊畬ι缃幻襟w是管制的。
問:目前中國政府逮捕了一些網(wǎng)絡(luò)上的意見領(lǐng)袖,并加緊了對網(wǎng)絡(luò)的控制,這是否對你的“中國的網(wǎng)絡(luò)審查者嚴(yán)格審查集體性行動(dòng)而非批評性言論”的結(jié)論提出了挑戰(zhàn)?
答:我并不知道這種逮捕的情況目前有多普遍,目前我們知道有一些網(wǎng)絡(luò)名人被逮捕,但是中國有數(shù)以百萬計(jì)的網(wǎng)民。也許政府覺得通過逮捕一些意見領(lǐng)袖來對網(wǎng)民提出警告,也許政府希望通過提升不確定性來有效加強(qiáng)自己的權(quán)威。一般來說,在一個(gè)法治社會,法律可以提供一個(gè)清晰的界限。但是當(dāng)法律界限在一個(gè)社會變得特別模糊的時(shí)候,是可以對民眾起到恐嚇作用。也許這就是目前中國政府想達(dá)到的,也有可能他們逮捕一些具體的人是出于并不相關(guān)的原因。總之我并不是太清楚。
歐陽斌是專欄作者,現(xiàn)居紐約。