跳至主要內容

參與 Taiwan Open Data Census心得(2)

*
讀這篇之前請先讀:About Open Data Census Taiwan(初期心得)、參與 Taiwan Open Data Census心得(1)

資料的所有者不是地方政府機關:
在評批的過程中,採購契約、選舉投票資料、商工公示資料清冊、空氣品質資料、公司登記資料,在地方政府的網站上僅提供連結到政府電子採購網、中選會、經濟部商業司、環保署的監測資訊站,有些地區因為未設置空氣監測站而無法提供數據。
即時路況資訊部份地方政府會直接連結到交通部運輸研究所(以下簡稱運研所)或國道高速公路局單位所建置的即時交通資訊網站,有些地方政府會運用運研所之資料,建立一個即時交通資訊網站,但也無法提供使用者下載使用這些資料。
就大眾運輸時刻表,由於當地的交通規劃,可能是由當地運輸業者提供時刻表供人下載參考。
資料格式不易編修、也不易被機器讀取:
依照「政府網站版型與內容管理規範」中第5項第6條中對政府入口網站及主題網站中檔案下載格式之規定,需要提供一種可編輯(如:純文字檔或其他商業文書檔案)或具開放性(如PDF、.odt、HTML)的檔案格式。在政府開放資料平臺中的資料多屬於開放格式的資料,如.csv、XML、.json等機器可以直接讀取的資料,然而不被刊載於開放資料平台中的資料,在其他的政府網站則多會提供PDF或是Word、Excel、PowerPoint、HTML、格式的檔案,並進行加密,讓使用者下載後也無法取得檔案內的資料進行資料分析或運用,這樣的情況不止出現在縣市政府網站,中央機關部會的網站也有同樣的情況。
如前述的交通事故資料而言,有些地方政府的警察局會提供已處理過的分析資料,提醒用路人哪些路口易發生事故,但若是要讓民眾運用資料進行分析或是設計學童的安全上學路線(如:加拿大的School Zone)是無法自由運用的。
就網站評比機制上,相較於其他各國原有較成熟的評審制度,而台灣今年則第一次將地方政府網站加入評比,同時評比的人選也是開放於網路上自由加入,所以可見到以下的情況:
評比者的來源:
目前的評比者的來源主要以自動參與為主,並未設置任何的要求或規範。
無一致的評分標準:
由於部份地方政府已成立資料開放平台或是利用現有的政府資料開放平台提供資料,但有些政府則是以公開資料的方式呈現,在評比時可能也無法公平評分。
由於前述部份資料的擁有者並非當地縣市政府,造成對評比標的網站之標準無法一致。
同時,因為評比者並未先對評分標準有一致的共識,在給予分數的標準也不一致,同一評比人員可能會因為不同時間的加入或評比資料而給予不同分數。
評比者本身對台灣地方政府網站的熟悉度不同
由於評比者對台灣政府網站資料的熟悉度不同,不了解資料可能會散落於哪些地方政府部門,造成可能會誤判該資料不存在的情況出現。
國情及語言的障礙
目前的評比網站介面還是以英文為主,而設計的項目也是以其他國家的架構來擬定,所以相較於台灣,會有國情不同,調查的項目不同,但提供的資料在台灣可能都是同一部會所提供,或是原本就不存有該份資料,而文字上的不同也容易造成進入障礙,有些使用者可能清楚中文資料放在哪個網站的位置,但因為評比項目為英文,卻因為語言進入障礙而在評比上增加阻力。
填寫後不易修改
因為程式設計及為求公平性,若需要更改前次的錯誤,則需要重新再進行一次評分,還需要透過另一位檢視人員審視過後才能進行更正,若是參與的人少,無法即時修改,也同樣造成評分修改上的阻礙。

結語:
由於部份的地方政府對於「資料開放」的觀念仍保留在「公開資料」的階段,所提供的檔案都不具有前面提到的開放資料的特點,而資料的著作權仍然屬於各地方政府部門,使用者若要使用資料仍然無法自由取用,也不易找尋。不需要急著建立自己的政府資料開放平台,因為國家發展委員會所提供的政府資料開放平台並不是只給中央部會機關使用,目前線上可見到台南市政府與嘉義市政府都有使用這個平台。
就台灣本地的評比者、評比平台來說,可能需要評比者們對於評分制度有一個共識、有共同的評比標準,了解各評比項目的內容是什麼及在各地方政府部門的資料位置所在,以著重其內容、架構、資料品質進行評比,才能達到公平也客觀,較能提供有效的建議,讓公部門與民眾之間能平行的交流與互動。

留言

此網誌的熱門文章

為什麼我支持《數位中介服務法》草案

在經歷許多次反抗台灣政府所立的網路相關法案後,我其實沒想過除了《數位通傳法》草案外,我還會再支持另一部法律草案,雖然 《數位通傳法》草案還壓在某處,但如果有人讀過《數位通傳法》的草案,再讀這部《數位中介服務法》草案,就會知道這部草案的重要性,而且也可以顯示台灣網路使用者的成熟度,更重要的,這是我第一次看到引入國際網路治理多方利害關係人機制的法律草案,而且是用在正確的地方。 有興趣想知道我在讀法條時的筆記和當下的感想,可以看我這則  Tweet 。這篇不使用逐條讀法條的方式來寫,因為那會讓人昏昏欲睡,我也不去比對歐盟《數位服務法》,因為我在讀《數位服務法》草案時,該草案特別強調是加強歐盟 E-Commerce Directive  ,而不是取代它,而且更多著重在預防盜版、仿冒,保護消費者的法案。所以當有輿論提到參考自《數位服務法》的《數位中介服務法》草案限縮言論自由時,我其實是一頭問號的,但一直到今天我才有時間讀《數位中介服務法》草案,這篇文章出自於我的個人經驗和閱讀法案的心得,與擔任的職務無關。 如果最近注意一下網路的資訊,有幾件事該注意一下: 有許多人在社群平台,如Facebook或是其他網路看到一些廣告,而這些廣告可能是要你支持台灣農產品、台灣製的產品,結果你收到時,上面還寫著簡體字,通常這是所謂的一頁式廣告詐騙,而行政院的消費者保護會在 2019 年時就有新聞稿在警告「 一頁式廣告詐騙多 小心查證保障多 」,之後像公視或是其他單位都有相關的活動在提醒大家小心這類廣告。但目前這些廣告其實多數不易處理,因為不容易取證、保留證據,等到追查到時已經找不到對方了。 有不少親密照片與影片在情侶分手後,被報復性的上傳到情色網站或透過即時通訊傳到親友的帳號裡,或是被洩露個資,遭到公開的霸凌。 之前有一個專題:「 青春煉獄:網路獵騙性私密影像事件簿 」,光是讀完這個專題報導我就覺得受傷。 有人使用 Deep Fake 把台灣名人的臉部照片合成至色情影片再上傳至色情影片平台,今年 7 月才被判刑。 還有許多創作者藉由網路分享作品時,被人盜用,甚至有國外的使用者修改台灣人的作品去參與比賽還獲獎。 有一次打電話問某個部會,如果消費者在國外電子商務平台買東西,但資料被外洩怎麼辦?雖然政府願意協助,但衡量至國外打官司的時間和成本,就會讓人卻步。 有些行為在現實世界裡有法...

在 2024 年結束前,我想聊聊生成式 AI 應用的影響

大約在 2023年初,因為 ChatGPT 出現,在當時提供我非常大的幫助,雖然那時的 GPT 反應不快,精準度約 80%,但比靠自己有限的英文聽力與對法律文字的理解能力,它提供的協助比當時的 Google Translate 還多,雖然我還是得周末加班處理,別人連假出去玩,我只能在家裡翻譯錄音及重新撰寫文章,但隱約已有不安的感覺:「身為研究人員,依賴這些工具後,我存在的價值在哪裡?」 在工作裡,生成式 AI 協助我翻譯、校正文字、重組文句、擬問卷題目。當我撰寫好一篇內容後,它可以幫我檢查別字(我很容易有別字)、贅字,或是它會協助挑出一般人不易理解的字句,並提供建議,而我會參考它的建議,再調整文章內的字句。它相當於一個輔助的編輯,在我把文章交給編輯前,先調整文章內容,提高可讀性。有時我請它翻譯文章,裡面有我無法理解的句子或字詞,就會請它解釋到我能以白話理解、表達為止。 隨著使用它的頻率增加,我也去聽關於學術倫理與人工智慧的演講。台上的講者提到一位博士班學生一直寫不出論文,在無法延長修業年限的情況下,使用 ChatGPT「編」出一本乍看之下很真實的著作。當時的 GPT 沒有 4o 有多種功能,但正經八百的與人說瞎話的功能已經令人刮目相看。當這本論文到達指導教授的手上,有經驗的教授第一眼就看參考文獻,馬上被教授抓到破綻--參考文獻的中作者根本沒有出版那篇論文。當時已經有預防論文抄襲的判讀系統,避免學生抄襲,但也曾經因為對非英語母語寫作者的寫作方式而誤判的案例。教授給這位博士班學生一個機會重新撰寫他的畢業論文,但最後,這位博士生仍然無法產出論文,除浪費時間外,在學術倫理評價上也被留下污點。 因為這件事,我如果在撰寫文章時有使用 AI 工具輔助,我多會在文末註明,該篇文章是與哪一個 AI 合作產出,我也會讓主管與同事知道,我使用 AI 在工作文件中提供哪些協助,這已成為我個人的習慣。 隨著可以應用的工具愈來愈多,我也看到許多文章、報告裡都出現 AI 工具的痕跡,有時使用者以為其他人看不出來,但這些痕跡很明顯,如果作者能自我揭露,是一件很好的事。當然現在沒有任何規定、規範要求撰寫者這麼做,但聽同事說國外的期刊已經要求作者自我揭露,我想國內應該也會有相關的要求。 在台灣,政府也提供使用生成式AI的參考指引。台灣行政院在 2023 年 8 月底公布由國科會擬定的「 行政院及所屬機...

從開放式電子紙閱讀器的需求來談資料可攜與互通性

這個炎熱的周末,我沒有外出,而是在家中閱讀。「閱讀」在日常生活中很重要,不管是讀社群媒體的文字或是書籍裡的文字,我是一個貪讀的人。然而就像個體經濟學裡的公式,欲望無窮,卻受限於(Subject to)空間大小,我不得不縮減藏書的空間,曾一度堅持只有商管書籍才買電子書,才能擁有更多擺放文學或小說書籍的空間。但在通勤、旅途中,還是希望有一本可以滋潤心靈、滿足想像空間的書籍可以度過極度乏味,且蜷縮在經濟艙無法伸展的四肢,或躺在醫院蒼白充斥著苦難人生氣味的病榻上,能因為作者的文字而使思緒不受現實限制而飛舞在另一個世界中,不是被吞沒在黑暗狹窄的機艙座位或藥水味的病房,又或是日復一日無起伏的日常生活中。小小的電子閱讀器裡的書櫃是心靈的另一個寄託,於是我在電子出版平台上買了吳爾芙的《論自我與寫作》、《自己的房間》,去年在病床上讀了《「我反對!」不恐龍大法官RBG第一手珍貴訪談錄 》引起護理師們的好奇,問我為什麼不滑手機而是一直在讀電子書。 我的第一台電子閱讀器是 Amazon Kindle,是當時的上司送給工作單位每個員工的禮物。那陣子我準備出發去柏林,我收到了閱讀器實在開心不已。當時已在考慮採購電子閱讀器,但在各家閱讀器間糾結,受限於各家閱讀平台與閱讀器及預算限制,我必須精打細算。由於自己已經有平板,所以覺得平板電腦暫時就夠了,所以一直沒有動手採購,直到上司把閱讀器放到我手中,才知道使用電子閱讀器實在太愉快,沒有被干擾、就是專心的閱讀,享受作者的文字。第二台是 Readmoo的第一代MookInk,Kindle當時只能閱讀英文書籍,我還是習慣讀中文,閱讀中文的速度比較快,也更容易產出心得,所以我還是購買中文電子閱讀器。我常在登機坐定可以開啟電子產品後,就開起閱讀器閱讀,它成了我的行動書櫃。近期也買了Kobo的彩色電子閱讀器,主要的原因在於,我可以在Kobo的平台上買到我需要的外文書籍,我不需要把中英文書籍分兩個閱讀器,而Kobo的軟體介面整合的不差,例如有些文章可以暫存到Pocket裡,我可以在通勤時閱讀短文。 電子書還是有電子書的限制,因為不同不台的閱讀器並不互相支援,所以我在 Google Playbook 購買的電子書,無法輸出至 MooInk、Kindle、Kobo 的電子閱讀器中,我在博客來、Google Playbook購買的電子書,也只能使用平板閱讀。在電子書還沒...