當開放數據遇上區議會

剛剛結束的區議會選舉掀起一股海嘯,顛覆地區政治版圖之餘,亦為各區捲來大批素人、傘兵、專業人士等政壇新血。青年人的參與方式不單只有從政,亦有資訊科技從業人員用網站整合互聯網的開放數據,用專業技能讓選舉過程更透明,方便選民及候選人作清晰判斷,若干網上應用已初露崢嶸。長遠而言,善用開放數據可幫助市民深入了解議會,監察代議士言行及政府施政,促成基於事實的公民參與生態,對各方皆有利。

善用開放數據 網民自發搭建事實平台

今次區議會選舉有兩個民間自發的網站令人耳目一新,分別是「Vote4.hk」及 「選區事實處」(https://hkfactcheck.io/),皆為資訊科技從業人員利用工餘時間籌備,設計簡潔卻資料豐富。兩者的共通之處乃用 「眾包」(crowdsource)方式實時蒐集並顯示各票站投票率。區別是前者著重呈現各區選民特徵,後者集中匯聚候選人資料。

「Vote4.hk」首頁只有選舉結果圖表,風格極簡。直接點開某一區,可見每小時投票率折線圖、選民年齡性別等人口柱狀圖、選區劃分地圖及主要屋苑等,亦為人口特徵貼上標籤,顯然是幫助候選人熟悉選區,尤其是欠缺政黨資源的素人。以筆者熟悉的中西區為例,石塘咀選區就標註為「偏多新移民」、「偏高齡」、「家庭月入偏低」等。而位處西半山的大學選區就有「家庭月入甚高」、「甚多大專畢業生」等標籤,基本符合筆者日常觀察。

「選區事實處」則匯集候選人過往言論、投票紀錄、議會發言及利益申報等,聲稱作為「文宣以外另一個深入了解社區服務人士的途徑」,顯然是為選民服務,提供可為投票作參考的資料。平台資料採集自傳媒網頁和各區區議會網站, 網民亦可以透過「回報問題」或「提交事件」補充。

不過,上述平台亦未盡完善。譬如,「Vote4.hk」為大學選區貼上「甚多新移民」標籤,相信是因為數據來自人口普查,所謂「新移民」極有可能是無投票權的外籍專業人士,半山東、衛城、山頂等中上產乃至富豪選區均有此標籤,但其實對選舉並無太大參考價值,大數據算法及標籤有待改進。「選區事實處」就未有交代清楚事實核查的程序。

各區文件格式不一 礙大數據分析

作為公民社會自發搭建的平台,短時間內能有如此效果已經值得讚賞。若言要形成基於事實的健康選舉和議會文化,其實當局/從政者的責任更加重大,做好開放數據是較容易踏出的一步。

例如,其中一個公認可靠的事實來源是各區議會網站公布的投票紀錄及會議紀要。問題在於十八個區議會網站發布的文件格式不一,中西區用Word刊載會議紀要,而灣仔區則用 PDF,內文排列更千差萬別,不符合開放數據的「互通性」(interoperability)準則,增加用大數據方法作批量分析的難度。解決方式並不複雜,由協調機構對會議文件各式作更清晰指引即可。其實各區網站已經大體一致,統一文件格式應不會太困難。

換血後的各區議會將有一番新氣象,透過更廣泛的社區參與打造開放透明的議會完全符合多數新議員的理念,例如可更妥善處理以往廣受詬病的地區工程撥款等問題,開放數據可發揮正面作用。

文:周穗斌(香港互聯網協會研究員)
2019年11月