Вы не вошли.
Тред для обсуждения текстовых ИИ в контексте писательства: ролевых игр, додать себе редкопейринга, написать пейзаж для главы или подсказать вотэтоповорот.
Для удобства поиска отзывов используйте тег #ии_истории.
Наверно я слишком долго сидел на гемини, который знает мой канон и не путается, что попытавшись попробовать glm, оказался разочарован. Очень обидно, аноны так завлекательно рассказывают.
естественно, глм уступает гемини, это всё-таки нейронка с открытыми весами, а на корпорат.
хотя он на гемини очень смахивает, поскольку его обучали на похожих датасетах. даже галлюцинации те же
А мой канон глм знает лучше дипсика
Ну или галлюцинирует меньше. Но результат мне нравится.
Мне Дипспик как-то наглючил вообще новый "канон", потому что персонажа из мелконеха знать не знал. Но такое тотал-ау мне даже удивительно вкатило какориджем. Там по итогу от персонажа одно имя, характер и видовая принадлежность остались, но все остальное вообще другое. Я прост устал в какой-то момент уточнения давать и решил: ой, да кури, что хочешь, посмотрим как глубока эта кроличья нора.
Один из моих канонов ГЛМ кстати тоже знает лучше как минимум Клода, и путается меньше, чем Гемини.
Вообще надеяться что нейронка знает ваш канон дело неблагодарное. Если вы не по Гарри Поттеру играете конечно, да и то. Все самое важное все равно должно быть в карте, потому что нейронки ничего не "знают" на самом деле, их нейронная сеть хранит данные очень сжато и с потерями, вообще удивительно что она хоть что-то помнят, даже громадные, как Гемини (но чем больше сетка тем больше она знает/помнит, конечно, поэтому корпораты та много и знают), учитывая степень сжатия. По предположениям/слухам Гемини, кстати, в 15-20 раз больше ГЛМ.
Я пробовала с ДС в ГП играть. Ну такое. Он как бы знает, но как-то оно странно, как будто чего-то не хватает. Хз, как объяснить. В общем, я забила по реальным канонам с ЛЛМ играть, только ориджи, только хардкор.
А ГЛМ мне очень нравится тем, как он характер персонажей держит. Он намного меньше застревает на какой-то одной черте, а делает персонажей более разносторонними, более живыми.
И еще один огромный плюс: он с легкостью переключается с бота на НПЦ когда это необходимо. У меня в промте прописано, что он должен отыгрывать бота и НПЦ, он это честно делает. Даже групповой чат не нужен, он сам по себе может вести и бота, и всех НПЦ, в том числе и прописывать НПЦ на ведущих ролях. С ДС приходилось из кожи лезть иногда чтобы он просто пару реплик от имени НПЦ написал когда бот не в кадре, а не перескакивал на бота, обрывая сцену персоны. Фактически с ДС мне приходилось НПЦ самой писать, а с ГЛМ вообще лафа. Я ему в ООС факты об НПЦ скармливаю, и он их даже запоминает и юзает.
Отредактировано (Сегодня 08:04:40)
В общем, посмотрела я на свой баланс в ОР, вздохнула и пошла искать варианты. Внезапно нашла Nanogpt. Может все это и так уже знают, но вдруг кто как я не слышал. Это типа ОР, только с подпиской. Можно платить и за отдельные генерации, но, учитывая сколько я потратила в этом месяце на ГЛМ, мне их подписка про за 8$ кажется очень выгодной. Вроде дают ГЛМ и ДС все платные модели по подписке без ограничений на количество генераций.
Пока еще присматриваюсь, но провайдера на Виверне уже создала, АПИ принял.
в ГП играть
С ГП, ну, по моим личным ощущениям, у всех нейронок почему-то проблемы. Если не контролировать линию поведения персонажей, то получается ООСный пиздец. Подозреваю дело банально в том, что фандом популярный, играют в него убойное кол-во народа и каждый пляшет в меру личного безумия верхом на фанонах.
Зато СПН мне уже нравится больше, нейро хорошо справляется с рядом персонажей, но вот, как ни странно, самый популярный Дин, у которого на том же Джаниторе по фандому какое-то конченое количество ботов, очень часто, как и с персами ГП превращается в ООСный пиздец, особенно в групповых чатах.
Короче, по моим личным ощущениям одинаково плохо и когда канон мелконеховый, и когда он (либо конкретный персонаж канона) слишком популярный. В первом случае сетки ничего не знают, во втором путаются.
Отредактировано (Сегодня 09:28:42)
если кто будет пробовать, если несложно, отпишитесь, пжл, как впечатления
Анончик, только начала пробовать, скопировала Отоме)
Я играю на русском, так что пока заметила такую проблему ГМЛ 4.7 начинает миксовать русский с английским (где-то одно слово, где-то часть предложения, где-то целиком абзац).
Допоскаю, что мог быть микс первого поста (англ) и моегоп оста (рус)
ГМЛ 4.7 мне вообще несет какую-то чушь, честно говоря. Смешивает языки, пишет посты в стиле "предложение на десять строк без знаков препинания и заглавных букв", отвечает не на мой пост, а на собственный же предыдущий свайп... Возможно, пообкатается и станет лучше, но пока пользоваться им я не могу. С Дипсиком 3.2 раньше было похожее, когда его только добавили, сейчас он пишет совершенно нормально.
другой анон
Отредактировано (Сегодня 11:22:21)
ГМЛ 4.7 мне вообще несет какую-то чушь, честно говоря. Смешивает языки, пишет посты в стиле "предложение на десять строк без знаков препинания и заглавных букв", отвечает не на мой пост, а на собственный же предыдущий свайп...
Ого, у меня такого нет. Может, уменьшить температуру попробовать? У меня 0.7 стоит (на единице дипсик нес чушь, может, у ГЛМ те же проблемы).
Ого, у меня такого нет. Может, уменьшить температуру попробовать?
У меня 0,65 для всех моделей и никого так не распидорашивает)))
Анончик, только начала пробовать, скопировала Отоме)
глм в принципе не очень работает на русском. я обычно пишу нейронке на русском и прошу отвечать на английском, юзая перевод страницы.
глм в принципе не очень работает на русском.
Он очень хорошо может на русском, по крайней мере 4.5 и 4.6 никогда с этим проблем не испытывали.
Собственно, ни одна из крупных сеток не испытывает.
.
Он очень хорошо может на русском, по крайней мере 4.5 и 4.6 никогда с этим проблем не испытывали.
Собственно, ни одна из крупных сеток не испытывает.
у меня даже 4.6 периодически подмешивал английские слова (одно или два) в ответ на русском, даже с другими промптами. иногда в ответе на английском может китайский иероглиф сунуть.
Вроде дают ГЛМ и ДС все платные модели по подписке без ограничений на количество генераций.
формально ограничение есть, 60к запросов в месяц. другой вопрос, что его исчерпать очень сложно, лол.
глм 4.6 они гоняют квантованный, есть версия с думалкой, есть без думалки.
есть отдельный эндпоинт для сайтов вроде джанитор, чтобы мышление нормально передавалось.
ограничений по токенам нет вообще.
могу дать рефералку, по ней скидка на подписку должна быть.
Анончик, я у Nanogpt Клоды увидела, они входят в подписку или надо отдельно их оплачивать?
Драгон, который давно хочет с Клодами поиграть и думает, куда податься.
Анончик, я у Nanogpt Клоды увидела, они входят в подписку или надо отдельно их оплачивать?
Драгон, который давно хочет с Клодами поиграть и думает, куда податься.
нет, в подписку входят только модели с открытым кодом
Что-то в последние пару дней чутесовский дипсик ужасно отупел, и по старым настройкам выдает отборную херню(( подскажи плз, куда можно переползти, чтобы играть без впн и чтоб провайдер принимал предоплаченные карты? И желательно чтобы был вариант просто деняк на счет закинуть, я слишком мало играю, подписка не выгодна(
подскажи плз, куда можно переползти, чтобы играть без впн и чтоб провайдер принимал предоплаченные карты?
Опенроутер, я там с ГЛМ играюсь и все очень удобно. Предоплаченные карты ест без возражений.
Внезапно нашла Nanogpt.
У них большинство моделей по подписке с Чутеса, у него кстати тоже есть подписка. Модели там значительно хуже качества, из-за кванта или из-за криво настроенной инфраструктуры уж не знаю.
Я тыкался везде, и скажу тебе так, везде, где на третьесторонних сервисах, подписка (особенно если туда входят корпораты) есть какая-то наебка. Некоторые очень молодые странненькие сервисы подсовывают левые модели или реверсы с системным промптом вместо дорогого Клода например. Модели стоит брать у родных провайдеров (у ГЛМ подписка 3 доллара за 150 запросов в 5 часов, а с Дипсиком на родном АПИ выйдет примерно столько же в месяц). Сторонних провайдеров стоит использовать тех, про которых ты знаешь, что они разбираются в том, что делают. Например, та же Новита гоняет кванты, но у них нормальная инфра и поэтому их кванты работают лучше чем то, что хостит Чутес. Artificial analysis сайт делал разбор разных провайдеров GPT-OSS-120b, и там у лучших провайдеров разница в 5% на бенчарках (см. раздел Endpoint Evaluations), что можно объяснить архитектурой железа у Groq/Cerberas/гуглов (у всех трех свои чипы), но нельзя у всех остальных. Когда разрабы Кими выкладывали свои тесты (я сейчас не найду быстро, видел на реддите), у них там была разница в 30% (!) в тул юзе. На их железе Кими 90% тул юзов выполняла успешно, на некоторых других провайдерах 60%.
не понимаю, вроде у меня есть подписка на гемини, туда вроде как входит 3-про но почему то при попытке использовать ключ в джаниторе пишут что нет токенов Оо
кто то пробовал гемини напрямую подключать?
могу дать рефералку, по ней скидка на подписку должна быть.
Спасибо, анончик, но я уже подписку оформила (
Модели там значительно хуже качества, из-за кванта или из-за криво настроенной инфраструктуры уж не знаю.
Да, это понятно. У меня есть подписка зай, но ее АПИ не получается скормить платформе на которой я с телефона играю. Так что оф.апи я в таверне юзаю, а это мне будет когда на телефоне погонять надо.
Я уже маленько поиграла, ну, не так уж и плохо. Особо не заметно разницы с ОР. Только ризонинг упорно отказывается отдавать, ну да ладно. ОР тоже ризонинг в виде какой-то каши давал, а этот хотя бы просто чистый текст выдает, который не надо потом править.
Только ризонинг упорно отказывается отдавать
у наногпт специфические условия для отдачи ризонинга.
во-первых, эндпоинт: https://nano-gpt.com/api/v1thinking/chat/completions
во-вторых надо включить стриминг текста и юзать ризонинг-версию модели.
наногпт раздает кванты, но если охота попользоваться несколькими моделями, это хорошая штука. у них и мистраль последний есть, и Кими, и глм и разные версии дипсика. они ещё недавно включили в подписку менее цензурную версию глм 4.6. хотя не знаю, что там расцензуривать, модель слабая на защиту.
Поиграл сутки с ГЛМ 4.7, что имею сказать. Из плюсов: контекст держит лучше Дипсика — запоминает ООСы, понимает логику типа "куртку персонаж в квартире снимает", сам вспомнил неочевидный культурный момент, связанный с датой. Хорошо держит характер персонажа. Очень интересно читать ризонинг: мало того, что иногда там просто дополнительные коры/варианты аутпута, ещё и показывает, что у бота в голове (но тут должен отметить, что я раньше о ризонинге только слышал, может, это у всех думающих моделей так, а я удивляюсь очевидному). Пишет живо, без лупов, без тупых штампов — ну, разумеется, насколько об этом можно судить за сутки более-менее интенсивной игры.
Минусы: Долгий. Ответы генерит примерно по полминуты. Если начал падать, то это надолго, страницу приходится обновлять постоянно (это я тот анон, у которого он на виверне падает как мразь). Дорогой шокапец: я закинул десять баксов на ОР, уже почти три ушло, а у меня не сказать чтобы до хрена длинные чаты были, скажем, в сумме не больше двухсот сообщений с момента подключения, в том числе и потому, что долго приходится ждать генераций без ошибок. Для сравнения, на Дипсике мне тех же десяти баксов хватает на месяц за глаза.
Но при этом, когда я в какой-то момент отчаялся получить ответ от ГЛМ, переключился на Дипсик, и мне по щщам прилетело старым добрым "you're a menace" и курткой и ботинками на персонаже, который только что вышел из душа в полотенце.
Отредактировано (Сегодня 20:59:03)