Як повідомляє «НБН» із посиланням на матеріал AXIOS, Anthropic, що є компанією-розробником Claude 3 Sonnet і Міненергетики США, залучили фахівців Національного управління ядерної безпеки (NNSA) до вивчення відкритості зазначеної ШІ-моделі.
У процесі тестування використовується методика «червоних запитів» (Red Teaming), за якої експерти навмисне спробують ввести в оману/спантеличити ШІ-систему для виявлення її вразливостей. У цій конкретній ситуації, фахівці NNSA мають намір змоделювати сценарії, в яких кіберзловмисники спробують виманити у Claude 3 Sonnet секретні відомості про ядерну зброю.
В Anthropic додали — це перша фаза подібних тестів для штучного інтелекту (тривалість — до лютого 2024 року), які проводять в умовах абсолютної секретності, а успішні випробування допоможуть розширити сферу співробітництва з урядовими структурами, одночасно посиливши безпеку ШІ.
Раніше ми писали про те, що вчені показували, як існуючі ШІ-моделі впоралися з нестандартним математичним тестом.