關於觀測站
報導者觀測站——立委選舉結束後,監督問政內容才要開始
「報導者觀測站」是一個立委發言觀察與監督平台,我們運用生成式AI及自然語言處理技術將近4萬筆立委的發言紀錄進行議題分類與摘要(目前起始點是從2020年第10屆立委問政開始),全面解析所有立委在任期內的問政內容與其關注焦點,讓議場上的對話不再只是即時新聞中的破碎資訊,或像卷宗般束之高閣,而是以完整、白話、近用性高的方式呈現,期待能梳理出更具透明度與公共性的公民監督立委問政方式。
操作說明
讀者可以在首頁「選立委」中,挑選出自己感興趣的立委,觀察該位立委最常發言的議題、發言的重點、提議的修法方向及價值主張。同時,讀者也可以在首頁「選議題」瀏覽自己感興趣的議題,觀察哪些立委最常參與相關討論,以及該議題在不同時間點的討論方向有何變化。若欲快速查找特定對象,可以透過首頁下方的「篩選」功能或是頁面右上角的「搜尋」功能查找特定時間段中,您感興趣的立委或議題。
在每位立委的個人頁面中,我們整理了他的任期屆數、提案通過數等資料,用以觀測該立委的資深程度以及在本屆的影響力。更重要的是,頁面也會顯示立委在該屆加入哪些委員會,台灣國會屬於「委員會中心主義」,多數重要法案需經委員會逐條審查後才會送交院會表決,因此立委所處的委員會,往往可以反映出其專業領域及關注內容。藉此,讀者可以進一步比對立委的專業角色與實際發言內容是否相符。
立法院業務會劃分進不同委員會,包含「常設委員會」與「特種委員會」。前者為常態運作機制,立委根據專長、關注領域或政黨安排分配,專責審查特定領域的提案,如國防外交、交通等;後者則視任務需要才臨時開議,如修憲委員會、程序委員會等。
《報導者》如何進行議題分類及摘要?
本網站前身為《報導者》於2024年立委大選前發布的「你家立委4年來為哪些議題發聲?各黨立委質詢主題有何差異?馬上查閱每位立委5大關注議題」,當時團隊透過LDA主題模型技術將第10屆立委過去4年的23,511筆發言逐字稿分為178個議題(經各領域專家檢核),並製作成簡易儀表板,讓選民查詢自家立委為哪些議題發聲。 第11屆立委上任後,《報導者》持續更新研究方法,使用生成式AI技術,針對第11屆立委發言進行議題分類與摘要,以下是完整方法論:
- 基本資料預處理: 《報導者》自立法院、中選會官方網站的公開資料中,抓取第10屆、第11屆的立委選舉、補選資料,整理出兩屆立委清單(包含中途離職及上任),其中包含立委選區、類型(區域/不分區)、最終所屬政黨及其委員會參與紀錄。
- 逐字稿處理: 每當立法院會期結束,《報導者》會更新兩種原始資料,第一種是立委發言逐字稿,通常以單一立委在單一會議中的發言為單位,逐字稿包含立委與官員、會議主席的完整對話內容,此數據取自立院議事轉播系統,並經立院議事處人員及發言者核實後發布。
- 以生成式AI進行議題分類及摘要: 《報導者》採用 OpenAI 所推出的GPT-4o以及 Anthropic 所推出的 Claude 3.7 Sonnet 的API作為AI摘要及分類工具的主要技術基礎,兩者在2025年初皆是全球最廣泛使用的生成式AI模型,在長文本歸納、多輪對話的上下文脈絡連貫能力上都有良好表現。 我們將指派給AI的任務分成兩個:分類、摘要。我們整理先前透過主題建模歸納且經政治、財經、國會監督領域專家審核的議題清單,並且加上近期報導者編輯台關注之重大時事議題,請AI根據逐字稿內容,自議題清單給定2至5個議題標籤,並列點摘要立委的發言觀點,聚焦其引述的核心律法、訴求與主張,以及官員回饋。 AI將任務執行完畢後,《報導者》數據團隊逐筆檢核初步結果,重新調整議題清單,盡可能確保每個議題的命名方式具體,議題間層級相近且互斥。經人工調整後,再由AI重新以新議題清單為基礎重新爲逐字稿分類,再進行第二次人工校對。
- 資料驗證與查核: 根據《報導者》AI使用守則,團隊產製之所有新聞內容須由人類進行最後審核、把關及決策,生成式AI所創建之任何素材,不得在缺乏「人工監督」下逕行使用與發布。「報導者觀測站」作為我們長期維運的產品之一,我們亦遵循此原則,在數據團隊完成分類及摘要後,《報導者》政治、財經、國會等各路線資深記者會一同針對分類及摘要結果進行審核與調整,確保發布內容足夠嚴謹、準確且清晰。 註:為確保分類結果的穩定性與品質,《報導者》團隊亦與外部自然語言處理專家合作,透過過去累積的人工校對資料,訓練出專為本專案打造的分類器模型。未來,網站上的分類流程將以該分類器為主體,並由《報導者》編輯團隊進行最終校對;線上生成式AI模型將轉為輔助角色,進行初步摘要,並支援分類器在關鍵詞判讀與語意判斷上的不足之處。 此舉旨在兼顧分類流程的穩定性與處理效率,進一步強化結果的可控性與公信力,不僅提升執行效能,更是根據《報導者》在議題設定、公共性與語意準確上的編採原則量身打造,確保模型判斷能貼近我們對新聞品質的要求。
「報導者觀測站」涵蓋多少資料?更新頻率為何?會再加入其他資料?
目前本網站已上傳第10屆所有會期、第11屆第1會期、第2會期的立委發言資料。未來預計於會期結束後1至2個月內上傳新會期資料。 此外,本網站未來也預定納入資料較為公開完整的地方議會,初期將先加入台北市、新北市、桃園市、台中市、台南市、高雄市等六都議會所有議員的問政內容與提案資料。
我覺得某個摘要或分類內容有問題,應該怎麼辦?
本網站內容已經多輪專家核實,但由於資訊量龐大,因此可能仍有漏網之魚。我們非常重視讀者的意見,若您發現本網站中出現不實、錯誤的分類或摘要資訊,敬請您協助填寫回報表單。
可直接點擊本頁面右下方的「問題回報」或前往本頁面最下方點擊「意見回饋」完成回報!
特別感謝
Google「台灣新聞數位共榮基金」
g0v「繁體中文AI開源實踐計畫」
歐噴有限公司OpenFun
中研院資訊科學研究所副研究員黃瀚萱
政治大學新聞學系教授鄭宇君
問題回報
用行動支持報導者
獨立的精神,是自由思想的條件。獨立的媒體,才能守護公共領域,讓自由的討論和真相浮現。
在艱困的媒體環境,《報導者》堅持以非營利組織的模式投入公共領域的調查與深度報導。我們透過讀者的贊助支持來營運,不仰賴商業廣告置入,在獨立自主的前提下,穿梭在各項重要公共議題中。
你的支持能幫助《報導者》持續追蹤國內外新聞事件的真相,邀請你加入 3 種支持方案,和我們一起推動這場媒體小革命。