OpenAI випустила бенчмарк SimpleQA для оцінювання точності ШІ — 42% правильних відповідей у найпотужнішої LLM

Обсуждение статей и новостей сайта
Відповісти
Автор
Повідомлення
Scoffer
Member
Аватар користувача

Повідомлення

Пропоную обговорити OpenAI випустила бенчмарк SimpleQA для оцінювання точності ШІ — 42% правильних відповідей у найпотужнішої LLM
Але загалом є тенденція до того, що моделі завищують свою впевненість у відповідях.
Люди теж завищують впевненість у відповідях, так що все по плану. :laugh:
спойлер
Зображення
vmsolver
Member

Повідомлення

Давайте внедрять инструменты подверженные галлюцинациям. Ну что может пойти не так? ))

И ещё не много про "не так"
ai_do.jpg
Kashtan
Member
Аватар користувача
Звідки: Яготин

Повідомлення

Це щось дуже потужно. Колись задавав наукові питання жпт 3.0 - то при перевірці виявилось що цей штучний "інтелект" все вигадував - точних відповідей було нуль.
Keyser Soze
Member

Повідомлення

Вот, что выдал AI по определённому запросу (база данных на конец 2023 года, 2024 ещё не учитывался):

Оценка расходов:
  • Усилия людей на развитие и поддержку AI (80-90%):
    $261.6 - $294.3 миллиарда тратится на зарплаты специалистов, обучение моделей, инфраструктуру и эксплуатационные расходы.
  • Вклад AI в помощь людям (10-20%):
    $32.7 - $65.4 миллиарда – это теоретический эквивалент стоимости пользы, которую AI приносит через автоматизацию, аналитику, оптимизацию и другие формы помощи.
Кто на кого работает - вот, в чём вопрос! :gigi: :lol: :up:
А правильно или нет - AI п*х. Учитесь, "кожаные мешки" :gigi:
Востаннє редагувалось 04.11.2024 17:12 користувачем Keyser Soze, всього редагувалось 1 раз.
Ortyomko
Member
Аватар користувача
Звідки: Дніпро

Повідомлення

Keyser Soze: 04.11.2024 17:09 Вот, что выдал AI по определённому запросу (база данных на конец 2023 года, 2024 ещё не учитывался):

Оценка расходов:
  • Усилия людей на развитие и поддержку AI (80-90%):
    $261.6 - $294.3 миллиарда тратится на зарплаты специалистов, обучение моделей, инфраструктуру и эксплуатационные расходы.
  • Вклад AI в помощь людям (10-20%):
    $32.7 - $65.4 миллиарда – это теоретический эквивалент стоимости пользы, которую AI приносит через автоматизацию, аналитику, оптимизацию и другие формы помощи.
Кто на кого работает - вот, в чём вопрос! :gigi: :lol: :up:
А правильно или нет - AI п*х :gigi:
студент тоже больше тратит чем даёт пользы.
Это же только начало.
Keyser Soze
Member

Повідомлення

Ortyomko: 04.11.2024 17:12
Keyser Soze: 04.11.2024 17:09 Вот, что выдал AI по определённому запросу (база данных на конец 2023 года, 2024 ещё не учитывался):

Оценка расходов:
  • Усилия людей на развитие и поддержку AI (80-90%):
    $261.6 - $294.3 миллиарда тратится на зарплаты специалистов, обучение моделей, инфраструктуру и эксплуатационные расходы.
  • Вклад AI в помощь людям (10-20%):
    $32.7 - $65.4 миллиарда – это теоретический эквивалент стоимости пользы, которую AI приносит через автоматизацию, аналитику, оптимизацию и другие формы помощи.
Кто на кого работает - вот, в чём вопрос! :gigi: :lol: :up:
А правильно или нет - AI п*х :gigi:
студент тоже больше тратит чем даёт пользы.
Это же только начало.
Т.е. студента с первого курса запрягают работать на коммерческую организацию? :gigi: Это в продолжение разговора...
Но в любом случае сравнение некорректное, я так считаю!
dead_rat
Member
Аватар користувача
Звідки: Берлін

Повідомлення

Keyser Soze: 04.11.2024 17:09 Вот, что выдал AI по определённому запросу (база данных на конец 2023 года, 2024 ещё не учитывался):

Оценка расходов:
  • Усилия людей на развитие и поддержку AI (80-90%):
    $261.6 - $294.3 миллиарда тратится на зарплаты специалистов, обучение моделей, инфраструктуру и эксплуатационные расходы.
  • Вклад AI в помощь людям (10-20%):
    $32.7 - $65.4 миллиарда – это теоретический эквивалент стоимости пользы, которую AI приносит через автоматизацию, аналитику, оптимизацию и другие формы помощи.
Кто на кого работает - вот, в чём вопрос! :gigi: :lol: :up:
А правильно или нет - AI п*х. Учитесь, "кожаные мешки" :gigi:
Я вражений, якщо цифри хоч якось дотичні до реальностію
Бо з попереднім хайпом на бєтховєн цифра вкладу була величезною, але зі знаком мінус.
TheDmytrius
Member

Повідомлення

vmsolver: 04.11.2024 12:53
И ещё не много про "не так"
ai_do.jpg
Это точно!
Відповісти