2024年1月,ISO與IEC聯(lián)合發(fā)布《系統(tǒng)和軟件工程-系統(tǒng)和軟件質(zhì)量要求和評估 (SQuaRE) -人工智能 (AI) 系統(tǒng)質(zhì)量評估指南》(ISO/IEC TS 25058:2024)。
人工智能(AI)系統(tǒng)的評估具有挑戰(zhàn)性。因此,低質(zhì)量的人工智能系統(tǒng)可能會對關(guān)鍵操作和決策的自動化產(chǎn)生相當(dāng)大的影響。
技術(shù)規(guī)范旨在指導(dǎo)人工智能開發(fā)人員對其人工智能系統(tǒng)進(jìn)行質(zhì)量評估,但并未說明準(zhǔn)確的測量值和閾值,因為這些值和閾值因每個系統(tǒng)的性質(zhì)而異。相反,技術(shù)規(guī)范為人工智能系統(tǒng)質(zhì)量的相關(guān)方面提供了全面的指導(dǎo),以便成功進(jìn)行質(zhì)量評估。
只要每個特性和子特性都能通過測試策略進(jìn)行驗證,測試就屬于本指南的范圍,但測試方法和測量的細(xì)節(jié)在其他地方也有涉及,例如 ISO/IEC/IEEE 29119 系列。
關(guān)注“廣東技術(shù)性貿(mào)易措施”,獲取更多服務(wù)。