Pull to refresh

Comments 30

давно посещала мысль взять родной клиент телеги и немного пофикить его, чтобы заветная кнопка транслита появлялась не только с премом а сообщения на разшифровку улетали не туда куда их телега шлёт а куда нибудь куда я хочу. но лень оказалась сильнее.

Не только вас, есть клиент iMe для андроид который голосовые до минуты длинной расшифровывает без премиума с удивительным качеством. Правда он странно определяет продолжительность - иногда можно и полторы минуты расшифровать, а иногда и 35 секунд не даёт.

Для начала нам нужно получить ключи разработчика телеграм, это легко: https://core.telegram.org/api/obtaining_api_id

Легко-то легко, но:

Due to excessive abuse of the Telegram API, all accounts that sign up or log in using unofficial Telegram API clients are automatically put under observation to avoid violations of the Terms of Service.

Нужно просто не нарушать Terms of Service, и в данном случае, я не вижу нарушений у моего приложения. Без ведома пользователя оно ничего не отправляет, статусы не подделывает, исчезающие сообщения не хранит.

здесь я расскажу, как я попробовал решить для себя эту проблему

Я обычно, либо просто игнорю эти сообщения, либо, если это невозможно (шеф, к примеру отправил, хотя у меня такого еще не бывало, это гипотетически) всячески откладываю его прослушивание. Это мотивирует таких любителей поговорить использовать текст в чатах, если им нужна оперативность. Ну а если что-то прямо горит капец как - есть, блин, телефон!

И вот удивительно.. как-то на одном из прошлых проектов один коллега сильно любил эти голосовые сообщения и фигачил их в рабочий чат без остановки, я вообще ни одного не прослушал, и ничего не потерял от этого.

кто-то в ответ на голосовые начинает отправлять видео, как он на бумаге пишет ответ, или как он набирает его в ворде

интересный вариант, надо попробовать)

Когда некоторые любители голосовых не понимают, что слушать их опусы, как правило, срочные, у меня нет возможности, сообщаю об этом. Если понимания не возникает, второе сообщение могу вовсе проигнорировать до появления подходящих обстоятельств прослушивания. Если голосовые продолжают сыпаться (почему-то это происходит в перемешку с текстовыми о срочности), дублирую первое сообщение переведенное в qr-код. Картинкой. Не только лишь все догадываются, что такое сообщение можно прочитать, приложив примерно те же усилия, что с переводом голосового в текст, но моя совесть после этого абсолютно чиста.

Жду когда телега позволит запрещать голосовые в личных чатах

Она позволяет. Тем кто покупает Premium)

Но даже премиум не запрещает и не блркирует сторисы((

Все сторизы вроде нельзя, но если подержать палец на конкретном сторизе, то можно срыть сторизы этого человека и так медленно и методично скрывать их все)

Служебные от Telegram иногда всплывают, их скрыть нельзя.

Поставьте клиент, который позволяет. Это по сути базовая функция любого клиента

Альтернативные клиенты в помощь. На Винде есть 64gram, на ведре TurboTel (а также несколько других), на огрызке NiceGram, например. И строим можно отключить, плюс ещё несколько полезных свистоперделок: например, показ айди юзера или группы в профиле (удобно для разработки и дебага).

Она позволяет, но я делал бота, который просто удаляет в ЛС голосовые)

В случае, если голосовые данные обрабатываются или хранятся на серверах мессенджера или сторонних сервисов, это может вызывать опасения по поводу их защиты и возможности несанкционированного доступа к ним. В целом это интересное технологическое достижение, но его реализация должна учитывать важные аспекты безопасности, конфиденциальности и соблюдения законодательства.

А совсем-совсем локально, прям на телефоне, где установлен мессенджер? termux?

Не думаю, что это запустится в termux, но теоретически можно было бы написать нативное приложение для андроид, которое будет использовать маленькую модель распознавания речи. Вот с пунктуацией сомневаюсь, там модель больше и ест около 2 гигов оперативки.

Смущает скрин, а именно то что написано "изменено".

Потом сообразил, не успел отредактировать сообщение.

Бот сначала выводит сообщение о том, что начал распознавать текст, а потом, чтобы не плодить сообщения, редактирует это сообщение вставляя туда этот текст. Так что "изменено" будет у всех сообщений бота.

Единственное, чего я не понимаю, так это, почему люди могут нажать "микрофончик" и отправить голосовое, но нажать другой "микрофончик", который преобразует речь в текст и отправить текст они не могут. Вероятно, они либо не знают про этот функционал, либо используют такое количество слов паразитов, мычаний и пауз, что распознанный текст выглядит совсем уж неприглядно.

и таки мы получим текст с бэ, мэ , паузами и паразитами))
зы: как-то, выйдя из себя на кучу голосовух когда я не мог их слушать мне попался запрос контактов ответственного лица, ну я и продиктовал в том же стиле, выдержал паузу и сказал "только там не 4, а 5"

Я на голосовые неспешно, размеренно, максимально подробно и с разъяснениями отвечаю голосовыми

тоже возьму на вооружение

А если бот ответил на голосовое собеседника, значит ли это, что я не увижу сообщение в списке диалогов как "непрочитанное"? То есть при ответе на сообщение, оно ведь автоматически считается прочитанным? Так ведь можно упустить что-то важное или не очень)

Или автор считает, что важные сообщения голосовыми не бывают?)

Бот специально устанавливает статус чата "не прочитано", но вроде как и без этого в мобильном приложении чат остается не прочитанным, когда бот получает сообщения. Так что с этим проблем нет, проверил.

А если все с ног на голову? Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял? Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод". И пусть они там между собой договариваются: Земля вращается - каждый своим делом занимается.

Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял?

Да, все верно

Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод"

Тогда он может ответить "нет", перевод удалится, а его голосовое останется, его такой вариант устроит и он не будет ничего дальше делать) Надо тогда и его голосовое тоже удалять.

Sign up to leave a comment.

Articles