AI

GPT-4能取代「優秀醫生」嗎？AI的2個硬性限制｜《AI醫療革命：GPT-4與未來》

2023/09/19

這些限制是當今AI領域的研究重點，同樣，了解人腦如何完成這些任務也一直是認知科學、認知心理學、神經科學甚至哲學等領域的長期課題。但對於本書的目的來說，重要的是它們限制了我們目前能夠讓GPT-4應用於哪些任務。

圖片來源：unsplash

GPT-4與「優秀的醫生」差別在哪？

差別一：主動學習能力

如果你對迄今為止我們對GPT-4的描述有所了解，你會發現它的行為與人類大腦非常不同。首先，人類可以在積極思考和與世界互動的同時進行學習。但是由於GPT-4不能以同樣的方式主動學習，它的基礎知識可能會變得過時。例如，如果 GPT-4 上次停機進行訓練的時間是在2022年1月，那麼它將不會學到該時間之後產生或發現的任何內容。在 GPT-4 的某些應用中，例如Bing搜索引擎，系統有時可以使用像網絡搜索引擎這樣的工具來回答需要最新資訊的問題。然而，大多數研究人員會認為缺乏主動學習能力是一個重要的、有時甚至是明顯的限制。在醫療領域，與時俱進非常重要，以至於一個被廣泛使用的醫生指南被稱為「UpToDate」（最即時）。

限制二：缺乏長期記憶、會話長度受限

當你開始使GPT-4進行會話，它是在一片空白的情況下進行的。當對話結束時，整個對話基本上都會被遺忘。此外，與GPT-4的會話也有長度限制。這個限制會不時改變（通常變得更長），但大致上只足夠處理一個長篇文件或文章，並就其進行對話。一旦達到會話長度限制，所有的對話就停止了，只能重新開始一個新的會話。這與人類大腦的運作方式非常不同，人類大腦有一種至今我們仍未完全理解的長期記憶能力，可以記住很久以前的事情。人類大腦還可以在必要時進行極長時間的對話，但GPT-4卻無法做到這一點。

這些GPT-4的限制對於醫療和醫學應用有著影響。例如，一個患者的完整病歷往往會超過會話長度的限制，所以導致GPT-4無法閱讀全部內容。（事實上，甚至患者的健康保險條款對於GPT-4來說可能也太長了！）現在能做的最佳方式是讓GPT-4閱讀數據的第一部分，進行摘要，然後開始一個全新的會話，讓GPT-4閱讀該摘要和下一部分的數據，以此類推。

此外，如果在GPT-4上次訓練後發現了一個新的醫學知識，除非有人要求它閱讀相關內容，否則它將對這個知識一無所知。如果這個新知識需要大量的文本來解釋⸺例如，可能需要閱讀幾篇長度很長的醫學期刊論文或處理大量的數據⸺那麼基於會話長度的限制，它可能完全無法處理。

缺乏長期記憶的GPT-4 無法自動記住一個月前與同一患者的互動，或者上週出現的類似患者。在醫療領域中，其他重要的應用也會變得非常困難。例如，患者風險分級需要對大量患者的臨床病史進行分析，然後挑選出其中那些最容易出現急性（且昂貴）病情的群體。考慮到GPT-4無法即時學習且缺乏長期記憶，它幾乎無法進行這項任務。

GPT-4的失敗往往發生在意想不到之處

檢查GPT-4在算術和數學方面的工作非常重要，因為它的失敗往往發生在意想不到之處。該系統的能力與人類的能力並不完全一致；對人類而言，非常困難的問題通常能夠可靠地由GPT-4解決，但另一方面，它有可能在看似芝麻蒜皮的小問題上給出錯誤的答案。而且不幸的是，到目前為止，我們無法真正預測它最有可能失敗的時候。

優化AI的方式：嘗試好幾次機會來解決同一個問題

結論那麼，我們該怎麼辦?到現在為止，我希望你已經了解到GPT-4令人難以置信的能力與巨大侷限之間的矛盾。首先，GPT-4仍然在不斷地演化與進步，在使用它的過程中，我們發現過去困擾系統的問題，現在可能不再是問題。此外，從根本上來說，不同的GPT-4會話很少對相同的提示給出同樣的回答，所以有時候如果系統能夠嘗試好幾次機會來解決同一個問題，它會做得更好。

我們目前最好的建議是人類使用者一定要驗證GPT-4輸出的答案（並使用GPT-4本身來協助驗證）。如果無法進行驗證，那麼就不要信任該結果。