![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Он полезен на самом деле. Есть две вещи в которых он реально помог и сработало.
1. Нашёл Clip-Interrogator и сказал как его поставить. Не очень важно но пусть будет
2. Посоветовал как убрать рекламу на ютубе в Тор. дело в том что мой goodbyedpi работает плохо и ютуб я стал смотреть в тор так вот там пошла агрессивная реклама от гугла примерно как в телевизоре вплоть до 1 минуты на 5 минут просмотра. И отказаться нельзя, Adblock и Ublock он распознаёт и говорит отключи или заблокуирую видео и блокирует. В итоге порлучается этот самый "железный занавес с двух сторон". В итоге обсудили с чатом политику гугла и он посоветовал как мягкий скрипт для tempermonkey так и важный плагин которывй мягко обходит рекламу стараясь не затронуьб антиплагиновые датчики гугла. Плагин называется AdNauseam. Агрессивная реклама ушла, осталась только небольшая задержка. Ну тут соревнование снаряда и брони...
3. Дал много советов по Forge и вообще по ИИ генераторам картинок и по текстовым моделям чуть, но тут неоднозначно, где-то полезно, где-то бесполезно, где-то даже вредные...
Вывод: использовать его как технического консультанта можно и полезно, но осторожно. Будет полезен, если ты чайник в теме или продвинутый, но далеко не специалист. Для специалистов вряд ли будет полезно, при глубоком бурении много лажает.
Особенности технического диалога с чатом мне напомнили структуру книги "Радио и телевидение это очень просто" - Е. Айсберг, 1979. Она у меня есть в бумажном варианте но и в интернете есть. Там вся книга построена в виде диалога где чайник "Незнайкин" беседует с примерным его ровесником но уже преподом "Любознайкиным" который как бы разжёвывает всё на его языке при том что сам Незнайкин имеет нормаьные школьные знания по физике и нормальтную картину мира.
UPD: Не всему что говоорит чат нужно верить и не на всё что он предлагает нужно соглашаться а то он и "чуть попрограммировать" для улучшения там какой-то модели "под себя" может предложить, ему то пофиг...
1. Нашёл Clip-Interrogator и сказал как его поставить. Не очень важно но пусть будет
2. Посоветовал как убрать рекламу на ютубе в Тор. дело в том что мой goodbyedpi работает плохо и ютуб я стал смотреть в тор так вот там пошла агрессивная реклама от гугла примерно как в телевизоре вплоть до 1 минуты на 5 минут просмотра. И отказаться нельзя, Adblock и Ublock он распознаёт и говорит отключи или заблокуирую видео и блокирует. В итоге порлучается этот самый "железный занавес с двух сторон". В итоге обсудили с чатом политику гугла и он посоветовал как мягкий скрипт для tempermonkey так и важный плагин которывй мягко обходит рекламу стараясь не затронуьб антиплагиновые датчики гугла. Плагин называется AdNauseam. Агрессивная реклама ушла, осталась только небольшая задержка. Ну тут соревнование снаряда и брони...
3. Дал много советов по Forge и вообще по ИИ генераторам картинок и по текстовым моделям чуть, но тут неоднозначно, где-то полезно, где-то бесполезно, где-то даже вредные...
Вывод: использовать его как технического консультанта можно и полезно, но осторожно. Будет полезен, если ты чайник в теме или продвинутый, но далеко не специалист. Для специалистов вряд ли будет полезно, при глубоком бурении много лажает.
Особенности технического диалога с чатом мне напомнили структуру книги "Радио и телевидение это очень просто" - Е. Айсберг, 1979. Она у меня есть в бумажном варианте но и в интернете есть. Там вся книга построена в виде диалога где чайник "Незнайкин" беседует с примерным его ровесником но уже преподом "Любознайкиным" который как бы разжёвывает всё на его языке при том что сам Незнайкин имеет нормаьные школьные знания по физике и нормальтную картину мира.
UPD: Не всему что говоорит чат нужно верить и не на всё что он предлагает нужно соглашаться а то он и "чуть попрограммировать" для улучшения там какой-то модели "под себя" может предложить, ему то пофиг...
no subject
Date: 2025-07-03 12:14 am (UTC)Мне пока что удалось начать гонять локально сервер, которому даёшь жпег, а он его описывает, что там на картине. Надо бы ему Пикассо и Кандинского показать, что скажет.
no subject
Date: 2025-07-03 12:44 am (UTC)Вот что мне выдал чат-gpt при анализке картинки в виде промта close-up of a cute tabby cat with green eyes lying on the floor, realistic lighting, shallow depth of field, detailed fur texture, warm tones, high detail, photorealistic, studio photography style
Вот чтоо выдал interrogator-capturer: there is a cat that is laying down on the floor, beautiful cat, cute cat, photo of a cat, a cute cat, calico cat, cute cat photo, beautiful huge eyes, cat photography, an adorable kitten, cute large eyes, cat - like scarlet eyes, big round cute eyes, awesome cat, cute kitten, huge adorable eyes, cute cats
А вот что выдал простенький describer встроенный в Foocus: a kitten lying on the floor with his paws hanging out
Сравнительный анализ чата приводить не буду, естественно он проанализировал это всё и себя как анализатора похвалил и порекомендовал (а как же!). Типа Foocus 1 звезда Blip 2 звезды а он сам 4 звезды 😂
Причём совершенству нет предела, мы с ним остановились на "Если захочешь — можем протестировать более сложную картинку, а заодно я могу помочь тебе настроить BLIP на выдачу более чистого, описательного промта без повторов и эмоционального мусора. Это возможно, если чуть отредактировать код или добавить post-processing фильтрацию." Но поскольку я не программерв вот это вод "чуть отредактировать код" меня естественно пугает и я пока не пошёл в эту сторону. А вы можете.
no subject
Date: 2025-07-03 01:35 am (UTC)no subject
Date: 2025-07-03 02:21 am (UTC)no subject
Date: 2025-07-03 11:24 am (UTC)no subject
Date: 2025-07-04 01:06 am (UTC)С его слов для этого нужно использовать специализированные OCR-инструменты: Tesseract EasyOCR или кастомные нейросети с обучением на датасете капч.
no subject
Date: 2025-07-03 05:50 am (UTC)no subject
Date: 2025-07-03 09:33 am (UTC)no subject
Date: 2025-07-03 04:14 am (UTC)no subject
Date: 2025-07-03 05:46 am (UTC)