跳至主要內容

參與 Taiwan Open Data Census心得(1)

TW Open Data Census

首先,我要說這份評比是由許多人合力進行的,而我只就我自己所參與的部份寫下我的心得。
從今年三月至今,看了台灣的各縣市政府的網站,也才了解到平時關注國外網站的時間可能都比瀏覽自己居住地的網站還要多。
在此,我再抄書一下。依照Open Knowledge Foundation對開放資料的定義,開放資料必須具備以下特性:
  1. 能容易取得、可以自由被使用,機器容易讀取,不受著作權法的規範,最多只能註明資料來源及所有人。
  2. 資料允許重覆被使用,也能與其他資料集混合重組後再傳播。
  3. 因為資料可以自由被使用、也允許被使用及散佈,所以不能限定資料的使用範圍。
台灣在今年參與了地方性的開放資料評比,將五都及各縣市政府都列在其中。評比的項目共有15項,分別為:
  1. 即時交通資訊
  2. 年度預決算
  3. 詳細支出(台灣則是觀察是否有提供支付及補助彙整表)
  4. 選舉結果
  5. 空氣品質(空污指數)
  6. 大眾運輸時刻表
  7. 公共設施
  8. 犯罪統計
  9. 採購契約
  10. 食品安全檢驗結果
  11. 交通意外事故記錄
  12. 建築執照許可
  13. 服務意見回饋資料
  14. 營業許可(公司登記資料)
  15. 商工公示資料清冊
台灣地方政府目前有:台北市、新北市、台中市、高雄市、宜蘭縣政府有提供自己的政府資料開放平台,台南市與嘉義市政府則是利用中央的政府資料開放平台提供地方的政府資料使用,多數縣市政府則是以「公開資料的格式」來呈現。在參與評比的過程中有遇到的狀況:
資料查找不易:
依台灣政府資訊公開法第7條的規定,上列的15項項目中,年度預決算、施政計畫、業務統計及研究報告都屬於公開資料。同樣依政府資訊公開法第8條第5項之規定,需要將規定需要公開的資料利用電信網路傳送或其他方式供民眾查找。所以在地方政府網站上所公開的資料,普遍刊載於網站上的公開資料專區中,如台北市政府曾獨立設置一個所謂的公開資料平台,讓瀏覽者直接瀏覽該公開資料網站之資訊。然而有些地方政府可能因為網站版面設計的緣故,將公開資料專區或是放置於不同的功能類別,造成網站瀏覽者在找尋相關資料的困難度。
而犯罪統計的相關資訊只能在內政部的統計資訊網站或是行政院主計處所提供的統計資料網站中查找各地方的犯罪統計數據;而交通意外事故記錄,並無法於縣市政府網站中的公開資料資訊區取得,則需要再連結至縣市政府的警局網站去查找相關的資訊,更可能會因為資料記錄時的行政流程,無法查詢意外事故發生的時間與地點。
關於地方政府所提供的年度預決算及每月的支付補助彙整表則依照行政院主計總處的規定而有一定的格式,一般民眾可能無法自格式中取得足夠的資訊,又或是無法解讀會計報表的意涵。
原始資料取得不易也無法批次下載:
如公共工程採購契約,僅管政府電子採購網上都有提供公開資訊,但需要另外付費下載標案說明書,在結標後卻少見即時更新標案頁面資訊,更無法批次下載相關的資訊。
又如建築執照的查詢,必須透過紙本送件,只能申請人單一申請個案,無法批量的下載資料,又或是無法直接取得資料。

後續:參與 Taiwan Open Data Census心得(2)

留言

此網誌的熱門文章

為什麼我支持《數位中介服務法》草案

在經歷許多次反抗台灣政府所立的網路相關法案後,我其實沒想過除了《數位通傳法》草案外,我還會再支持另一部法律草案,雖然 《數位通傳法》草案還壓在某處,但如果有人讀過《數位通傳法》的草案,再讀這部《數位中介服務法》草案,就會知道這部草案的重要性,而且也可以顯示台灣網路使用者的成熟度,更重要的,這是我第一次看到引入國際網路治理多方利害關係人機制的法律草案,而且是用在正確的地方。 有興趣想知道我在讀法條時的筆記和當下的感想,可以看我這則  Tweet 。這篇不使用逐條讀法條的方式來寫,因為那會讓人昏昏欲睡,我也不去比對歐盟《數位服務法》,因為我在讀《數位服務法》草案時,該草案特別強調是加強歐盟 E-Commerce Directive  ,而不是取代它,而且更多著重在預防盜版、仿冒,保護消費者的法案。所以當有輿論提到參考自《數位服務法》的《數位中介服務法》草案限縮言論自由時,我其實是一頭問號的,但一直到今天我才有時間讀《數位中介服務法》草案,這篇文章出自於我的個人經驗和閱讀法案的心得,與擔任的職務無關。 如果最近注意一下網路的資訊,有幾件事該注意一下: 有許多人在社群平台,如Facebook或是其他網路看到一些廣告,而這些廣告可能是要你支持台灣農產品、台灣製的產品,結果你收到時,上面還寫著簡體字,通常這是所謂的一頁式廣告詐騙,而行政院的消費者保護會在 2019 年時就有新聞稿在警告「 一頁式廣告詐騙多 小心查證保障多 」,之後像公視或是其他單位都有相關的活動在提醒大家小心這類廣告。但目前這些廣告其實多數不易處理,因為不容易取證、保留證據,等到追查到時已經找不到對方了。 有不少親密照片與影片在情侶分手後,被報復性的上傳到情色網站或透過即時通訊傳到親友的帳號裡,或是被洩露個資,遭到公開的霸凌。 之前有一個專題:「 青春煉獄:網路獵騙性私密影像事件簿 」,光是讀完這個專題報導我就覺得受傷。 有人使用 Deep Fake 把台灣名人的臉部照片合成至色情影片再上傳至色情影片平台,今年 7 月才被判刑。 還有許多創作者藉由網路分享作品時,被人盜用,甚至有國外的使用者修改台灣人的作品去參與比賽還獲獎。 有一次打電話問某個部會,如果消費者在國外電子商務平台買東西,但資料被外洩怎麼辦?雖然政府願意協助,但衡量至國外打官司的時間和成本,就會讓人卻步。 有些行為在現實世界裡有法...

在 2024 年結束前,我想聊聊生成式 AI 應用的影響

大約在 2023年初,因為 ChatGPT 出現,在當時提供我非常大的幫助,雖然那時的 GPT 反應不快,精準度約 80%,但比靠自己有限的英文聽力與對法律文字的理解能力,它提供的協助比當時的 Google Translate 還多,雖然我還是得周末加班處理,別人連假出去玩,我只能在家裡翻譯錄音及重新撰寫文章,但隱約已有不安的感覺:「身為研究人員,依賴這些工具後,我存在的價值在哪裡?」 在工作裡,生成式 AI 協助我翻譯、校正文字、重組文句、擬問卷題目。當我撰寫好一篇內容後,它可以幫我檢查別字(我很容易有別字)、贅字,或是它會協助挑出一般人不易理解的字句,並提供建議,而我會參考它的建議,再調整文章內的字句。它相當於一個輔助的編輯,在我把文章交給編輯前,先調整文章內容,提高可讀性。有時我請它翻譯文章,裡面有我無法理解的句子或字詞,就會請它解釋到我能以白話理解、表達為止。 隨著使用它的頻率增加,我也去聽關於學術倫理與人工智慧的演講。台上的講者提到一位博士班學生一直寫不出論文,在無法延長修業年限的情況下,使用 ChatGPT「編」出一本乍看之下很真實的著作。當時的 GPT 沒有 4o 有多種功能,但正經八百的與人說瞎話的功能已經令人刮目相看。當這本論文到達指導教授的手上,有經驗的教授第一眼就看參考文獻,馬上被教授抓到破綻--參考文獻的中作者根本沒有出版那篇論文。當時已經有預防論文抄襲的判讀系統,避免學生抄襲,但也曾經因為對非英語母語寫作者的寫作方式而誤判的案例。教授給這位博士班學生一個機會重新撰寫他的畢業論文,但最後,這位博士生仍然無法產出論文,除浪費時間外,在學術倫理評價上也被留下污點。 因為這件事,我如果在撰寫文章時有使用 AI 工具輔助,我多會在文末註明,該篇文章是與哪一個 AI 合作產出,我也會讓主管與同事知道,我使用 AI 在工作文件中提供哪些協助,這已成為我個人的習慣。 隨著可以應用的工具愈來愈多,我也看到許多文章、報告裡都出現 AI 工具的痕跡,有時使用者以為其他人看不出來,但這些痕跡很明顯,如果作者能自我揭露,是一件很好的事。當然現在沒有任何規定、規範要求撰寫者這麼做,但聽同事說國外的期刊已經要求作者自我揭露,我想國內應該也會有相關的要求。 在台灣,政府也提供使用生成式AI的參考指引。台灣行政院在 2023 年 8 月底公布由國科會擬定的「 行政院及所屬機...

從開放式電子紙閱讀器的需求來談資料可攜與互通性

這個炎熱的周末,我沒有外出,而是在家中閱讀。「閱讀」在日常生活中很重要,不管是讀社群媒體的文字或是書籍裡的文字,我是一個貪讀的人。然而就像個體經濟學裡的公式,欲望無窮,卻受限於(Subject to)空間大小,我不得不縮減藏書的空間,曾一度堅持只有商管書籍才買電子書,才能擁有更多擺放文學或小說書籍的空間。但在通勤、旅途中,還是希望有一本可以滋潤心靈、滿足想像空間的書籍可以度過極度乏味,且蜷縮在經濟艙無法伸展的四肢,或躺在醫院蒼白充斥著苦難人生氣味的病榻上,能因為作者的文字而使思緒不受現實限制而飛舞在另一個世界中,不是被吞沒在黑暗狹窄的機艙座位或藥水味的病房,又或是日復一日無起伏的日常生活中。小小的電子閱讀器裡的書櫃是心靈的另一個寄託,於是我在電子出版平台上買了吳爾芙的《論自我與寫作》、《自己的房間》,去年在病床上讀了《「我反對!」不恐龍大法官RBG第一手珍貴訪談錄 》引起護理師們的好奇,問我為什麼不滑手機而是一直在讀電子書。 我的第一台電子閱讀器是 Amazon Kindle,是當時的上司送給工作單位每個員工的禮物。那陣子我準備出發去柏林,我收到了閱讀器實在開心不已。當時已在考慮採購電子閱讀器,但在各家閱讀器間糾結,受限於各家閱讀平台與閱讀器及預算限制,我必須精打細算。由於自己已經有平板,所以覺得平板電腦暫時就夠了,所以一直沒有動手採購,直到上司把閱讀器放到我手中,才知道使用電子閱讀器實在太愉快,沒有被干擾、就是專心的閱讀,享受作者的文字。第二台是 Readmoo的第一代MookInk,Kindle當時只能閱讀英文書籍,我還是習慣讀中文,閱讀中文的速度比較快,也更容易產出心得,所以我還是購買中文電子閱讀器。我常在登機坐定可以開啟電子產品後,就開起閱讀器閱讀,它成了我的行動書櫃。近期也買了Kobo的彩色電子閱讀器,主要的原因在於,我可以在Kobo的平台上買到我需要的外文書籍,我不需要把中英文書籍分兩個閱讀器,而Kobo的軟體介面整合的不差,例如有些文章可以暫存到Pocket裡,我可以在通勤時閱讀短文。 電子書還是有電子書的限制,因為不同不台的閱讀器並不互相支援,所以我在 Google Playbook 購買的電子書,無法輸出至 MooInk、Kindle、Kobo 的電子閱讀器中,我在博客來、Google Playbook購買的電子書,也只能使用平板閱讀。在電子書還沒...