Я довольно долго был “вне” тренда нейронных сетей. Когда все их уже использовали во всю, я ничего с ними не делал. Я не видел их пользу в задачах, что у меня были. Потом, во-первых, мне дали работающие у нас в РФ ссылки, а во-вторых появились новые задачи. Сейчас я переживаю период нейросетевого энтузиазма.
В этой статье — как можно смотреть на сетки. Какие сценарии использования. В чём опасность. И ссылки на конкретные нейросетки и на разбор их работы.
Сценарии использования
У меня есть 4 сценария, в которых прибегаю к использованию нейросетей:
- “муторная рутина”. . Прошу сетку составить текст, который мог бы составить и сам, но лень. Работа в области, где я уже эксперт, но не хочу заниматься конкретно этим. Примеры: написать кусок кода, который бы вытащил из строки дату в нужном формате. Пересказать Ютуб-видео.
- “помощь в обучении”. Прошу сетку объяснить термины простым языком. Пример: при изучении теории групп прошу объяснить понятие “смежный класс” на уровне, доступном человеку без высшей математики
- “креативность”. Прошу сетку придумать несколько вариантов чего-то. Отчасти это тоже рутина: я бы мог и сам накреативить, но это потребовало бы много мозговых ресурсов. Пример: прошу нейросеть придумать несколько упражнений, которые я дам обучающимся Python
- “state of the art”. Пытаюсь узнать, как принято в некоторой области. Использую этот сценарий в кодинге: прошу сетку показать, как выглядит пример на новом для себя языке программирования. Или при переводе с русского на английский.
(замечание на полях. Последние два сценария — прямая задача GPT. Нейросеть обучается давать “вероятные” ответы. И “креативность” — когда ты просишь дать много вероятных ответов. “state of the art” — когда просишь один)
Нейросетки прокачивают рефлексию
на скриншоте: после недели попыток понять, что же такое Действие в теории групп я понял, чего на самом-то деле не понимал. Задал вопрос. Ответ прояснил зачем нужен термин, что уложило его в моей голове.
- GPT — буквальное воплощение идеи “задать правильный вопрос — половина решения”
- GPT — буквальное воплощение идеи “пока дураку объяснишь — сам поймёшь”
- GPT — как опытный сотрудник, объявивший итальянскую забастовку
Раньше я думал о работе с нейросетями как о некотором отупляющем действии. И это была ещё одна причина, почему я в них не лез. Сейчас я понимаю, что нейронные сети прокачивают навыки рефлексии и верболизации — очень важные для нас как для людей.
Осенью я стал обучать языку Пайтон людей, раньше не сталкивающихся с программированием. Я вижу, насколько сложно им даже понять, что спросить у сетки.
- я составлял рыбу рекомендательного письма. После нескольких дублей попросил держать спокойный тон и избегать необоснованных восклицаний.
- я разбирался с том, что такое “Действие” в теории групп. После… Недели попыток я допёр, что меня смущает: и там и там есть какая-то функция, и чем они отличаются — хз
- в пытался придумать “хорошее” определение изоморфизма в той же теории групп. Понял, что “хорошее” для меня — это краткое и без дополнительных терминов
Нейросетки полезны в задачах, в которых создание сложнее проверки
Нейросети врут. Точнее “галлюцинируют”. Они могут давать неверные ответы на заданные вопросы. Отсюда могло бы быть как будто бы следовать один из двух неверных выводов: “сетки, конечно, врут, но делают это очень редко, так что можно забить и верить им”. Или “сетки врут и поэтому использовать их нельзя никогда”.
Есть целый класс задач, в которых сетка используется идеально: задачи, в которых проверка на “лажу” даётся сильно дешевле, чем на составление.
- если я прошу придумать имена орков для D&D, я сразу увижу, если какое-то имя мне не нравится и надо будет его выкинуть
- если я прошу рыбу рекомендательного письма, то я могу таки прочесть его и посмотреть, а не приписала ли мне нейросеть чего-то лишнего
- если я прошу привести аналогию “что есть переменные”, я могу проанализировать эту аналогию и понять, насколько она хороша или плоха
Главная опасность нейросетей — они склонны к неочевидным ошибкам
Нейронные сети с большими языковыми моделями буквально созданы, чтобы быть убедительными.
Их схема работы — подбирать слова, которые скорее всего мы ожидаем увидеть. Т.е. они улучшаются в сторону, чтобы допускать всё меньше “очевидных” ошибок.
Хорошая новость в том, что чем меньше очевидных ошибок — тем меньше ошибок вообще.
Плохая новость — что когда сетка ошибается в области, в которой ты сам не эксперт — хрен ты эту ошибку за пассами руками увидишь.
В примере выше мне пришлось очень вчитываться и напрягать усилия, чтобы вообще предположить, что может быть что-то не то. Предположив, я спросил у другой сетки. И только после этого увидел, где могла быть ошибка и уточнил. А не предположив изначально я бы и всё за чистую монету принял
Ссылки на используемые мной нейронные сети
- chat.deepseek.com — бесплатная нейросеть с регистрацией. Инфы про лимиты я не нашёл… В первую очередь я использую эту сетку для задач по коду. Просил сочинить kotlin-native пример. Прошу примеры по Python. Просил найти где течёт память в программе и помочь с плагином для neovim… Специализированная версия для кодинга показывает очень хорошие результаты :)
- ask.chadgpt.ru — прокладка, дающая доступ к самым популярным сеткам. Платно. (очень ограниченно есть бесплатно). Но я купил подписку, она не такая дорогая. Доступ предоставляют к GPT, к Gemini, к Claude. И к сетям генерации картинок. Ещё есть API — я через него, например, настроил антиспам бота в Вожатнике (чате при вожатском паблике)
- chatpdf.com — чат для анализа pdf. Использую для анализа научных статей, когда я слишком глупенький. Бесплатно до вроде 3х pdf в день
- 300.ya.ru — яндексовская нейросеть, использую главным образом для пересказа видео на Ютубе
О том, как работает GPT
Работа современных нейронных сетей это большая и сложная тема. Но вот пара ссылок, которые могут помочь разобраться в теме:
обсуждение в Телеграм