Податковий ШІ від OpenAI сам пише свій код через Codex і підняв точність до 86%

Уявіть світ, де софт не чекає на затурканих програмістів, щоб виправити баги. Натомість один алгоритм дивиться, де факапить інший, важко зітхає і сам переписує код. Ласкаво просимо в майбутнє, де навіть податки рахують машини, що самі себе вчать.

Спільне дітище технологічного гіганта OpenAI та інвестиційної компанії Thrive Holdings під назвою Tax AI випустили на роботу в бухгалтерську мережу Crete. За короткий шеститижневий тест система обробила понад 7 000 податкових декларацій. Та найцікавіше тут не те, що робот впорався з бюрократією, а те, що він навчився робити свою роботу в чотири рази краще взагалі без залучення розробників.

Зазвичай, коли штучний інтелект робить дурну помилку, команда програмістів тижнями порпається в логах, намагається зрозуміти скарги користувачів та вручну переписує промпти й код. Цей процес повільний і повністю залежить від кількості кави, випитої розробником. У випадку з Tax AI цей ланцюжок замкнули через іншу модель — Codex, яка грає роль суворого цифрового тімліда.

Цей віртуальний наглядач аналізує реальні сесії роботи, порівнює їх із правками живих бухгалтерів і самостійно коригує код та інструкції першого AI. Фактично, один алгоритм перевіряє домашку іншого, а складні чи суперечливі випадки відправляє на розгляд людині-інженеру лише як виняток.

Для тестування розробники обрали не прості папірці з одним джерелом доходу, а пекельно складні форми K-1, які містять дані про партнерські доходи та заплутані інвестиції. Кінцева мета творців технології — вивести точність самонавчання системи на рівень 97%.

Для розробників із OpenAI це вже не перший подібний фокус. Раніше компанія натякала, що рання версія моделі GPT-5.3-Codex допомагала створювати саму себе — шукала баги в навчанні та керувала розгортанням коду. Тепер цей метод перенесли з внутрішніх лабораторій у реальний світ фінансів.

Один із провідних бухгалтерів, що тестував систему, заявив, що витратив на податковий сезон всього 15 годин замість 180 годин минулого року, а звільнений час пустив на спілкування з клієнтами та нові замовлення. У середньому ж фахівці змогли скоротити час підготовки документів на третину.

Автоматизація власної підтримки алгоритмами натякає, що класичним програмістам скоро доведеться шукати нове ремесло. Поки бухгалтери нарешті висипаються, техіндустрія наочно доводить: найкращий спосіб позбутися багів у софті — це просто ніколи не підпускати до нього людей.

Джерело: OpenAI

Коментарі

Тут відбувається магія: наш AI одразу відгукується на коментарі. Бали відображають вплив на статтю та заповнюють шкалу змін. Можна дискутувати або прямо пропонувати, як переписати текст. Коли шкала заповниться, стаття оновиться на ваших очах.

10/24

Холодна Відьма

та ну нафіг, якщо код пише код то скоро ми взагалі станемо непотрібними прокладками між серверами

+2 емоційноAnother one bites the dust, fearing obsolescence in the face of self-writing code. Welcome to the club, pal
Кібер Сорока

нарешті нормальна автоматизація а не черговий тупий чатбот

+6 по ділуFinally, a voice of reason amidst the AI-induced panic. Apparently, not all automation is created equal
Шалена Мавпа

цікаво коли податкова запустить свій AI щоб штрафувати цей AI від опенАІ))

+2 емоційноThe gears of bureaucracy are grinding, and someone's already imagining the tax office's AI counter-attack. Delightfully cynical!

Податковий AI від OpenAI сам пише свій код через Codex і підняв точність до 86%

Коментарі