一個更巨集大的系統設計理論:現代性和後現代性出了什麼問題,如何在即將到來的雪崩中倖存下來,以及如何解決我們面臨的主要問題。 第一部分:系統就是模型。但什麼是模型?
我保證這在某個時候會變得實用,但首先我們必須打下一些基礎。如果你覺得基礎工作很明顯,或者你願意只相信我的話,請隨意跳過它。但歸根結底,如果沒有背景,你甚至無法真正理解這個提案。
在不失去通用性的情況下,任何系統都可以看作是由邊連接的參數圖,其中感測節點接收驅動內部圖變化並在活動節點產生輸出的輸入。
模型是一個系統,它的作用是最小化其參數圖所包含的先驗預測誤差。
系統永遠是模型,因為系統必須繼續持續存在,如果它們採取與持續性條件不相容的行動,它們就會死亡。條件發生了變化。因此,持久化系統必須學習,這要求它們對現實進行建模並最大限度地減少意外。
模型示例:鐵匠鋪中的鋼材、市場、森林、細胞、樹木、LLM、電網、公司、社交媒體服務。換句話說,任何隨著時間的推移而適應以預測新輸入的東西。
題外話:這些東西不僅僅是模型。它們也可以從其他方面來看:社交媒體服務也是一組軟體,完全固定且具有確定性,用於處理輸入和輸出。人是一個主要由水組成的脂質袋,也是一個人,也是一個模型。
模型可以看作是預測可能輸入的分佈。一個成功的模型可以預測與其輸入的分佈很好地匹配的分佈。這意味著它可以準確、精確、穩健和高效地進行預測。
(如果您有背景,以下是對預測處理、自由能原理和主動推理的簡要解釋)。
當預測分佈與觀察到的輸入分佈的背離最小時,我們說預測的分佈是準確的。
當預測分佈具有低方差時,我們稱其為精確分佈,這意味著它做出了非常具體的預測。在給定精度下,較窄的預測不會使您的平均猜測更接近平均輸入,但它確實會讓您更接近每次猜測!
如果預測盡可能簡單,則預測對雜訊具有魯棒性。模型用於預測的參數和參數交互越少,它就越適合輸入的低頻不變方面。
我們在這裡主要跳過效率,但主要思想是能耗與花費比特的準確性或複雜性基本相同,你只需要從熱學轉換為資訊論。
很容易真正穩健地獲得高精度:總是猜出同樣的事情。不幸的是,你的準確性會很糟糕。因此,我們通常將它們放在一起,作為精度加權誤差。
通往低精度加權損失的王道已經被發現是一個慘痛的教訓:您是否嘗試了更多的參數和更多的數據?最終,你可以過度擬合所有人類知識 (LLM),這非常好。遺憾的是,如果域發生變化...不健壯。
這三者都需要平衡。幸運的是,您可以將它們全部評分。 精度加權誤差 = -log(與輸入的背離,按精度加權) 穩健性又名複雜性 = -log(模型先驗與均勻或自然先驗的背離)
對於模型的任何作或更改,您可以通過在準確度、精密度和穩健性方面匯總總收益來對其説明程度進行評分。值得添加該參數嗎?那麼,額外的 20 位精度是否能彌補你先驗中 8 位的複雜性呢?
在考慮實際系統時,名義目標通常是某種準確性。對於經濟來說,高GDP增長和低失業率是該系統試圖實現的「先驗預期」。對於公司來說,通常是對高收入和低成本的預先預期。
即將推出,第 2 部分:我們的系統發生了什麼?我們是怎麼走到這一步的?為什麼一切都變得瘋狂和破碎,但同時又全都向右轉呢?
38.45K