前篇提及在資料競賽平台 Kaggle 上有對抗 COVID-19 的專區,其中一個挑戰,是要從既有超過 57,000 篇研究文獻中,約 8G 的資料,包含 45,000 多篇關於 COVID-19、SARS-CoV-2 及其他冠狀病毒的研究全文資料集中,運用自然語言處理與其它人工智慧技術,從中發掘出新的見解,從而更好地對抗這嚴重的傳染疾病。
全球的研究持續快速增加中,用傳統醫學研究探討文獻的方法會跟不上,有可能會因此忽略重要或有關聯的研究與發現,因此運用此方法持續了解的需求已越來越迫切。
目標是回答以下問題,連過去以後,有每個任務的細節描述:
- 對病毒的傳播、潛伏期和環境穩定性瞭解多少?我們對該病毒的自然史、傳播和診斷有哪些瞭解?我們對感染的預防和控制有哪些瞭解?
- 我們對COVID-19的危險因素瞭解多少?我們從流行病學研究中瞭解到了什麼?
- 關於病毒的遺傳、起源和進化,我們知道多少?我們對病毒的起源和人畜交界處的管理措施瞭解多少?
- 我們對疫苗和療法有哪些瞭解?已發表了哪些關於疫苗和療法的研究、開發和評估工作?
- 關於醫療護理方面,已經公佈了哪些內容?發表了哪些關於外科手術能力和療養院的文章?已發表了哪些關於對欠缺資源狀態中,所需的資源分配的管理工作?我們對個人防護設備有哪些瞭解?已發表了哪些關於疾病管理建議的替代方法?在護理過程方面發表了哪些內容?我們對病毒的臨床特徵和管理有哪些瞭解?
- 我們對非藥物干預措施的有效性瞭解多少?對非藥物干預措施的公平性和遵守障礙有哪些瞭解?
- 在撰寫本報告時,COVID-19已經傳播到至少114個國家。對於病毒性流感,疾病的傳播方式往往存在地域差異,不同地區的病毒是否會有不同的變異。我們想通過這個任務,來探討一下文獻和數據對這個問題的看法。
- 我們對診斷和監測有哪些瞭解?已發表了哪些關於系統性、整體性的診斷方法(從公共衛生監測的角度到能夠預測臨床結果)?
- 已發表的關於研究倫理方面的考慮因素有哪些?已發表了哪些關於社會科學在應對疫情爆發時的社會科學方面的論文?
- 在共享資訊和部門間合作方面公佈了哪些內容?在數據標準和命名方面公佈了哪些內容?在政府公共衛生方面公佈了哪些內容?在風險溝通方面,我們瞭解多少?在與高危人群溝通方面公佈了哪些內容?發佈了哪些關於明確社區措施的內容?公佈了哪些關於公平的考慮和不公平的問題?