Придумать — это полбеды. Ещё надо свою мысль суметь донести. И если люди не всегда понимают друг друга, то куда уж тут нейросети. В итоге получается, что программы, призванные помогать и экономить время, зачастую лишь тратят его и приносят расстройство из-за того, что люди не умеют спрашивать.
Учёные Московского технического университета связи и информатики (МТУСИ) озаботились этой проблемой и разработали алгоритм для формирования правильных запросов (их ещё называют промтами) для нейросетей. Правильные запросы позволяют генерировать более качественные изображения в разумные сроки.
Руководитель пресс-службы университета Алина Хакимзянова отметила, что новый алгоритм предоставляет чёткую последовательность действий для составления запросов, определяя порядок и обоснованный выбор слов в промте. Это позволяет получать предсказуемые, корректные и качественные результаты. Для проверки алгоритма использовались онлайн-сервисы «Шедеврум» и Kandinsky, а результаты показали, что новый подход позволяет получать более корректные результаты генерации изображений, особенно при использовании сложных языковых конструкций.
В будущем планируется модифицировать алгоритм с учётом функционала современных нейросетевых сервисов и рассмотреть его применение для генерации текстового контента.
Фото: freepik