跳至主要內容

[政府資料應用] (巨量)資料分析研究成果發表會心得

今天參與了科技部和工研院的巨量資料成果發表會,那是一場很學術但時間不足的成果發表會,也曝露出:有資源、有關係拿到的資料更齊全的真實狀況。

同樣做空污與健康的研究,同樣是健保資料庫+開放的氣相資料+空污資料,元智大學有資本可以拿到更完整的資料,也因為他們本身是醫事相關學校、願意投入資源,再配合自己的資料庫,做出來的東西更容易令人印象深刻。 另一個案子的成員(學生)在發表前在旁邊碎碎念,念人家拿完整的資料,他們得從零開始,還冒出一句值得深思的話:『他們(元智)也不可能分享出來。』 

在學術研究的角度,當然不可能,但站在為人民的立場呢?如果是為了全國的健康呢?就像Theranos的創辦人Elizabeth Holmes將研究出來的技術都申請了專利,以商業立場來看是應該的,但能救人、改善醫療檢驗的技術申請專利似乎哪裡『不太清爽』。 

Open Street Map的應用和國際案例都被提到了幾次。

另外在台灣的1999因為技術問題一直無法放出資料。 在圖像辨識、文字探勘都提到共通問題-人工作業。為了避免法律責任、網站阻擋或是讓資料定位更準確,所以都會再透過人工再分類、定位。在期望的定義裡, 可透過『人力』解決/清理/定義的資料都不能叫『巨量資料』。 

最後一組是講犯罪資料,有三個子題。其中一個是常看到的犯罪地圖,在英美是透過報案資料來分析,中正大學直接和新北市府合作,結合司法院的開放資料同時直接取得獄政資料庫(校長曾有相關警政背景實在太方便了),在『合法』、不違反個資法的前提下也做了一些犯罪行為的分析,這個資料很敏感,可能還分析家庭背景、精神疾病狀態。 

不過,這些都讓我看到了:政府開放資料並不是同步的。 除非部會機關願意,不然民間人士只能拿到垃圾資料,零散、破碎,還要耗費時間清理;但只要進行研究計畫,相關的人員就有『方法』可以拿更齊全的資料。 

離開前,做犯罪行為研究的學生(剛好坐在附近)私底下問:『以後還拿得到獄政資料嗎?』看似老師的人回:『…繼續再配合的意願不高,再加上政局轉換……』老師搖搖頭。 

今天發表的成果裡,都用了一些時間在講述進行研究前與法務人員確認相關的法律責任,但要講法律責任的話時間依然不足,而成果就只能摘要式的報告了。 

最後,對於資料內容的不同步或是取得資料的方式有差異、政局的轉換也影響了各部會、各政策執行的意願,尤其是政府開放資料,這些都讓人感到氣餒。

歡迎參與相關討論:Taipei.io Google group 

留言

此網誌的熱門文章

為什麼我支持《數位中介服務法》草案

在經歷許多次反抗台灣政府所立的網路相關法案後,我其實沒想過除了《數位通傳法》草案外,我還會再支持另一部法律草案,雖然 《數位通傳法》草案還壓在某處,但如果有人讀過《數位通傳法》的草案,再讀這部《數位中介服務法》草案,就會知道這部草案的重要性,而且也可以顯示台灣網路使用者的成熟度,更重要的,這是我第一次看到引入國際網路治理多方利害關係人機制的法律草案,而且是用在正確的地方。 有興趣想知道我在讀法條時的筆記和當下的感想,可以看我這則  Tweet 。這篇不使用逐條讀法條的方式來寫,因為那會讓人昏昏欲睡,我也不去比對歐盟《數位服務法》,因為我在讀《數位服務法》草案時,該草案特別強調是加強歐盟 E-Commerce Directive  ,而不是取代它,而且更多著重在預防盜版、仿冒,保護消費者的法案。所以當有輿論提到參考自《數位服務法》的《數位中介服務法》草案限縮言論自由時,我其實是一頭問號的,但一直到今天我才有時間讀《數位中介服務法》草案,這篇文章出自於我的個人經驗和閱讀法案的心得,與擔任的職務無關。 如果最近注意一下網路的資訊,有幾件事該注意一下: 有許多人在社群平台,如Facebook或是其他網路看到一些廣告,而這些廣告可能是要你支持台灣農產品、台灣製的產品,結果你收到時,上面還寫著簡體字,通常這是所謂的一頁式廣告詐騙,而行政院的消費者保護會在 2019 年時就有新聞稿在警告「 一頁式廣告詐騙多 小心查證保障多 」,之後像公視或是其他單位都有相關的活動在提醒大家小心這類廣告。但目前這些廣告其實多數不易處理,因為不容易取證、保留證據,等到追查到時已經找不到對方了。 有不少親密照片與影片在情侶分手後,被報復性的上傳到情色網站或透過即時通訊傳到親友的帳號裡,或是被洩露個資,遭到公開的霸凌。 之前有一個專題:「 青春煉獄:網路獵騙性私密影像事件簿 」,光是讀完這個專題報導我就覺得受傷。 有人使用 Deep Fake 把台灣名人的臉部照片合成至色情影片再上傳至色情影片平台,今年 7 月才被判刑。 還有許多創作者藉由網路分享作品時,被人盜用,甚至有國外的使用者修改台灣人的作品去參與比賽還獲獎。 有一次打電話問某個部會,如果消費者在國外電子商務平台買東西,但資料被外洩怎麼辦?雖然政府願意協助,但衡量至國外打官司的時間和成本,就會讓人卻步。 有些行為在現實世界裡有法...

從開放式電子紙閱讀器的需求來談資料可攜與互通性

這個炎熱的周末,我沒有外出,而是在家中閱讀。「閱讀」在日常生活中很重要,不管是讀社群媒體的文字或是書籍裡的文字,我是一個貪讀的人。然而就像個體經濟學裡的公式,欲望無窮,卻受限於(Subject to)空間大小,我不得不縮減藏書的空間,曾一度堅持只有商管書籍才買電子書,才能擁有更多擺放文學或小說書籍的空間。但在通勤、旅途中,還是希望有一本可以滋潤心靈、滿足想像空間的書籍可以度過極度乏味,且蜷縮在經濟艙無法伸展的四肢,或躺在醫院蒼白充斥著苦難人生氣味的病榻上,能因為作者的文字而使思緒不受現實限制而飛舞在另一個世界中,不是被吞沒在黑暗狹窄的機艙座位或藥水味的病房,又或是日復一日無起伏的日常生活中。小小的電子閱讀器裡的書櫃是心靈的另一個寄託,於是我在電子出版平台上買了吳爾芙的《論自我與寫作》、《自己的房間》,去年在病床上讀了《「我反對!」不恐龍大法官RBG第一手珍貴訪談錄 》引起護理師們的好奇,問我為什麼不滑手機而是一直在讀電子書。 我的第一台電子閱讀器是 Amazon Kindle,是當時的上司送給工作單位每個員工的禮物。那陣子我準備出發去柏林,我收到了閱讀器實在開心不已。當時已在考慮採購電子閱讀器,但在各家閱讀器間糾結,受限於各家閱讀平台與閱讀器及預算限制,我必須精打細算。由於自己已經有平板,所以覺得平板電腦暫時就夠了,所以一直沒有動手採購,直到上司把閱讀器放到我手中,才知道使用電子閱讀器實在太愉快,沒有被干擾、就是專心的閱讀,享受作者的文字。第二台是 Readmoo的第一代MookInk,Kindle當時只能閱讀英文書籍,我還是習慣讀中文,閱讀中文的速度比較快,也更容易產出心得,所以我還是購買中文電子閱讀器。我常在登機坐定可以開啟電子產品後,就開起閱讀器閱讀,它成了我的行動書櫃。近期也買了Kobo的彩色電子閱讀器,主要的原因在於,我可以在Kobo的平台上買到我需要的外文書籍,我不需要把中英文書籍分兩個閱讀器,而Kobo的軟體介面整合的不差,例如有些文章可以暫存到Pocket裡,我可以在通勤時閱讀短文。 電子書還是有電子書的限制,因為不同不台的閱讀器並不互相支援,所以我在 Google Playbook 購買的電子書,無法輸出至 MooInk、Kindle、Kobo 的電子閱讀器中,我在博客來、Google Playbook購買的電子書,也只能使用平板閱讀。在電子書還沒...

各國政府在談資料跨境傳輸時,台灣需要什麼?

保護個人資料可能是各行各業的一個重要議題,不止增加了企業的資安相關成本也增加了法遵成本。尤其是需要跨國傳輸(個人)資料的企業,除了要配合各國的資料保護法(規範、規則)外,也要擔心資料外洩事件後續的成本,還有許多額外的行政手續。許多國家已經感受到資料流動的重要性,也紛紛的透過數位經濟協議、各種雙邊或多邊協議,來減輕企業跨境傳輸資料時的相關成本,以促進(數位)經濟發展,例如2018年時,美國、墨西哥、加拿大已簽署「美國-墨西哥-加拿大協定」(United States, Mexico, and Canada Agreement),讓這三個國家的企業可以在北美境內自由傳輸資料。 2019年由日本前首安倍晉三在世界經濟論壇和2019年的G20大阪峰會中提出提出「Data Free Flow with Trust」(簡稱DFFT),其核心概念是「基於信任的資料流通」。這樣的概念主要是建立彼此信任的跨境資料傳輸,促進資料自由流動,同時確保對隱私、安全和智慧財產權之信任。 在2019年G20大阪峰會時就已談出了DFFT的發展概念,2021年時已擬定發展的藍圖。當時也討論了所謂的資料在地化、資料主權等議題,並且也有著「資料的連結與使用是可提升生產力的重要因素,限制跨境資料流動,會是國際貿易體系的沉重成本之一,且資料在地化的要求可能會提高企業的生產與法遵成本」之共識。 到了2023年,因當時聯合國網路治理論壇(UN IGF)在日本京都舉辦、及G7日本廣島峰會的緣故,DFFT的概念再次被提出,且被熱烈討論著。G7廣島峰會裡則是建立了夥伴關係機制 (Institutional Arrangement for Partnership,IAP),並由OECD擔任協調的單位,來建立所謂的IAP;日本的JICA(Japan International Cooperation Agency)也在UN IGF 中提出執行 DFFT 之相關倡議。 如果有興趣進一步了解DFFT,可以閱讀: Digital Agency, Data Free Flow with Trust (DFFT) , World Economist Forum, Data Free Flow with Trust (DFFT): Paths towards Free and Trusted Data Flows 網路上的資料很多,...