Разное

Письменные русские буквы: Прописные буквы русского алфавита для первоклассников

Письменные варианты и формы русского языка при его использовании иностранцами и в интернете. Блог образовательного центра «Интенсив»

В современном мире Россия является одним из крупнейших импортёров товаров. Поставляя свои товары в Россию, производители, в основном китайцы, составляют инструкции и пишут этикетки, при этом экономя на переводчиках. В Турции, Египте, Тайланде пишут вывески и объявления для русских туристов. Зачастую писать на русском языке вынуждены люди, не знающие русского языка в Москве, а порой и те, которые не способны отличить одну букву кириллицы от другой.

В фильмах, комиксах и рисунках прослеживается модная тендеция писать кириллицей, а также лжекириллицей.

Возникает вопрос: правомерно ли считать текст русским, если количество ошибок, опечаток и грубых неправильностей не выдерживает никакой критики? Проанализировав набор разнообразных вариантов “неправильного русского”, я выделил критерии, исходя из которых можно заявить, что невзирая на неточности и нарушения, текст всё-таки является русским, а не просто написанным с претензией называться русским.

Со студентами, записавшимися на практический курс английского онлайн мы определили следующие признаки принадлежности текста к русскому языку:

Текст считается написанным по-русски, если

  1. Слова полностью составлены из буквы русского алфавита (кириллица) – 10%
  2. а) Слова понятны без перевода подавляющему большинству носителей русского языка (в том числе как единственного) и имеют смысл, то есть значение явлений наблюдаемого или воображаемого мира. В крайнем случае, о значении слова носитель языка должен догадываться – 40%

    б) Если смысл текста понятен, только при наличии знания иностранного языка – 15%

  3. Слова и каждая буква в них читаются по правилам русской фонетики и орфоэпии. Исключение составляют научные термины, особенно математические и компьютерные, а также цитаты, слова и буквы из других языков в тексте, например: V-образный, MS-DOS, X (икс), фраза “dura lex sed lex” – 20%
  4. Слова, составлены в предложения, построенные с учётом всех правил морфологии и синтаксиса современного литературного или разговорного русского языка – 20%
  5. Слова написаны орфографически правильно, в соответствии с правилами современного литературного русского языка – 10%

Важнейшим признаком принадлежности текста к русскому языку является второй. Текст, коэффицент которого менее 20% не может быть назвать русским текстом.

Со студентами, пришедшими на дистанционное обучение переводчиков с английского мы собрали образцы такие “перевода”

Образец 1.

Лжекириллица – алфавит, используемый в заголовках статей, вывесках, комиксах, буквы которого внешне напоминают буквы кириллицы, однако слова читаются по правилам английского, немецкого или испанского, в зависимости от языка текста. Кириллистическое звучание в рассчёт не берётся. А следовательно данный текст русским не является, но лишь создаёт иллюзию русскости или советов.

Замены:

  • A заменяется на Д и гораздо реже на саму А.
  • В на Б, Ъ, Ь или на саму В.
  • С без изменений
  • D – Ф или Д или без изменений
  • Е – Э, З, реже Е
  • F – Г или без изменений.
  • G – Б или… серп и молот!
  • H – Н или строчная Ч вместо h
  • I ,J, K — обычно не меняются
  • L – иногда Г
  • M – обычно без изменений, иногда Ш, Щ.
  • N – И, Й
  • О – Ф, реже сама О
  • P, Q – без изменений, хотя Q иногда по аналогии с О
  • R – Я
  • S – иногда развёрнутая Z, иногда Б или без изменений
  • T- без изменений
  • U – Ц
  • V – часто без изменений, а также перевёрнутая Л
  • W – Ш, Щ
  • X – Ж
  • Y – У, Ч
  • Z – без изменений или перевёрнутая.

Примеры

Текст следует читать как “One Empire – One rule”

Борат с Д вместо А.

RED SQUARE

НДРРЧ ТОЧ – это Happy toy. ОНО ЖОРОШО – опечатка в фразе “оно хорошо”. Далее мы видим, что лжекириллицей, в отличии от предыдущего примера, написаны не только английские слова, но и русские, например: ТРЧДНДЯ ТЕЖНОИОL – вместо “трудная технология”. Смешанный текст: МДТЯОSНКД – вместо “Матрёшка”.

ШЗДЯ – это ничто иное, как английское слово “WEAR” в русскоподобной транслитерации, хотя такая надпись на футболке сразу озадачивает русскоязычного покупателя данной продукции ФИLY TИЗ ЬЯДVЗ – это “Only the brave”, МФСКВД – Москва.

SPEEФОШЕТЕЯ – это ничто иное, как speedometer написанное лжекириллицей в мультфильме “Анастасия”.

Отдельного внимания заслуживает лжекириллистическая О, произошедшая от русской Ф, используемая во многих вывесках, рисунках, и даже попавших на линию спортивных товаров “Овечкин”.

Образец 2.

Набор иностранных слов на русской раскладке клавиатуры.

Щщдуееуы – есть слово oolettes набранное на русской раскладке клавиатуры. Несмотря на то, что данное слово не имеет значения ни в русской фонетике, ни в орфографии, и его графемы и звучание также не имеют места в других языках, оно не является лишённым смысла. Однако, будучи просто написаным “oolettes”, это слово бы вовсе не имело отношения к русскому языку. Реализуется только первый принцип, и то лишь частично, так что лжекириллица по сути ни чуть не является русским языком, а лишь отдаленно создает видимость его письменности. Не будем также забывать, что данное слово было написано, чтобы быть понятным русскоязычным посетителям, но на деле русские догадывались о заведении только благодаря надписям на других языках.

ФТЕШ АУФК ФСЕШМШЕН – это “anti fear activity”, набранное на русской расскладке.

Wish upon a star транслитеруется в русские буквы по фонетическому признаку. Непонятным остаётся только наличие в тексте македонской буквы НЬ.

Образец 3. Крупные ошибки и машинный перевод.

Чуть больше можно дать картине “Лоёда ано смерть”, так как слово “смерть” написано почти без ошибок, а в “Лоёда” угадывается “Победа”.

Образец 4.

Транслитерация текста с латиницы в кириллицу без перевода как такового. Инструкция для антенны, которая почему-то названа “Инструкция по эксплуатации электрочайник”

В инструкции также реализуется только первый принцип, степень реализации второго крайне незначительна, но тем не менее случайно присутствует (слова “антенна” и “сигнал”;).

Перевод: Love is a passionate crime, where only the guilty survive.

Образец 5. Транслитерация.

Транслитерация – есть передача текста одной письменности посредством другой.

В интернет-общении транслитерация широко используется, но её пользователи не имеют единого правила и пишут латиницей, исходя из правил разных языков: английского, немецкого, испанского, польского, пытаясь тем самым передать шипящие звуки русского языка. Букву “Ы” заменяют то на “i”, то на “y”, “Х” на “h”или “x” буквой j заменяют следующие буквы кириллицы: ж (ее также заменяют на zh), й, ь (он же ‘), а также звук [й]. Поэтому слово “южный” может в транслитерации выглядеть как juzhnyj, yujnii, juzhnjj, juzhnii, ugny,juzhny, jugni. А прохожий будет prohozhij, proxojii, proxozhiy, prohozhyi, proxozhyy.

Реализуется принцип 2 и 4.

В другом примере транслитерации буквы кириллицы заменяются похожими на них буквами латиницы, цифрами, знаками, зачастую просто потому, что программа не распознаёт русский текст или осутствует клавиатура с русской расскладкой

Пример

Реализуются признаки 2,3,4,5, принцип 1 немного пренебрегается, так как буквы не кириллистические, но очень похожие.

Однако, бывают случаи, когда заглавные буквы кириллицы напоминают определённые буквы латиницы, а если написать те же буквы в нижнем регистре – нет, и наоборот. В таких случаях транслитерации вкупе с электронным переводом, понимание затрудняется. Например, проникший в печать слоган группы Red Elvises Ytec n kpeh nwaka nhkom ot Cnonpr – это впеолне осознанные слова. Как расшифровать? Следующим образом:

  1. возьмём английский оригинал слогана группы Красные Элвисы ( Red Elvises): Kick Ass Rock’n’roll from Siberia т.е. Потрясный (дословно, пинающий под зад) рок-н-ролл из Сибири
  2. Переведём слоган с помощью электронного переводчика, получаем: “Утёс и крен ишака пинком от Сибирь”, так как по английски ass -это и задница, и ишак.
  3. запишем полученный русский перевод английскими похожими буквами: Ytec n kpeh nwaka nhkom ot Cnonp Утес и крен ишака пинком от Сибирь

Образец 6. Эрфоэпическое письмо. Популярно в странах, где многие говорят по русски. Например, страны бывшего СССР и Турция. Так как русским языком пользуются в основном устно, правила орфографии остаются за пределами их внимания. Написанные ими тексты, ценники, объявления, инструкции читаются легко, но орфографические ошибки заметны сразу:

Реализуются все принципы кроме пятого. Типичный пример письма людей, имеющих преимущественно разговорные и слухо-произносительные навыки в русском языке.

Образец 7. Смешанный текст. В данной инструкции буквы кириллицы смешаны с латинскими буквами. Графически схожие буквы перепутаны. В частности, буква М заменяет букву Т. Ц – вместо И, а также вместо Д, Л вместо П,

Эмо лроgукм лрцнцмъ
La уцсмый цмаъянскцй овенья шерсмь
Эмо лроgукм ест беслелныйе моцмый
Эмо лроgукм ест мовой цуеаы выбор
цатолле нкиэаяця щерстья

Перевод:

Это продукт примет
На чистый итальянский овечья шерсть
Это продукт есть последний модный
Это продукт есть новой ???? (среды? цены? моды? идеал?) выбор

Девочка и собака, гламур.

Ароматные носки.

Вывеска в Египте, местая “горбушка”. Найдёте всё, что захотите. Если будете покупать за 295 LE, получите 10% скидку. Наполовину реализованы пункты 1,2 и 3.

Образец 8.

С незначительным нарушение правила 6. Замена одной из букв кириллицы другой М вместо Т, Б вместо Д. Обычно понимание текста это совсем не затрудняет.

Примеры

“Прглашаем вуем”, вероятно появилось из-за того, что авторы не знали какой слово написать “приглашаем” или “приветствуем”

Образец 9.

Трудночитаемый текст, с постоянными заменами букв, не лишенный смысла. У русскоговорящего человека срабатывает узнавание слов, пусть даже написаннах с ошибкой, а также он замечает закономерности, благодаря которым читать текст становится легче. “Расота” – “работа”, “ачрес” – “адрес”, “Ь ьочу” – “в воду”, “сысмро” – “быстро”, “гапща” – “лапша”, “отщгно” – “отлично”, “Чысмроупемреёгенная” – “быстроуптербленная”, “осъясненце” – “объяснение”. Некоторые буквы действительно похожи на свои замены “и” – “ц”, “в” – “ь”, некоторые же заменены по какому-то иному принципу. Трудно реализуется второй принцип, соблюден первый, четвертый. И по замыслу третий и пятый должны быть реализованы, но этого не происходит, потому что были осуществлены неприемлимые в русском языке замены.

Отлично! Высокогачественный продукт. Быстроприготовленная лапша с куриным бульоном. Пищевые методы: Кладьте лапшу в чашку и вливать кипяток на 500 миллилитров (или лапша погрузнётся в воду). Покройте лапшу на 5 минут (или варите в кипятке 2-3 минуты, это сделает лапшу лучшей по готовому вкусной). Прибваьте приправки и кушайте. Объяснение: Данное является новым продуктом, который изготовлен с специальной системой по исследованию. Сухая лапша вкусна и хрустяща, варёная лапша богата (трофикой?). Это замечательна во время завтрака, нужна учения учёбы, работы, туризма и пикника. Удобно, сытно, вкусно и дёшево. Подходит и (помцгъц цоцчыц?).

Сваренная в масле

Листовка: Обработанные мука и растительное масло, порошок из курятины, разнообразные ароматические и острые вещества. Номер свидетельства по пищевому здравоохранению: №003874 Держите на месте прохладно и сухом Охранение качества: 6 месяцев Дата изготовления: Вес: 60 +/- 5% Адрес: уезд Юй Цэн, ул. Хуо Цансигу, д. 64 Тел 0370-4112977 Факс 03704112959 Индекс: 476300

Шорты с изображением 1000-рублёвой купюры. Вместо “Ярославль” написано “КРББААКАЬ”

Между Щ и Р находится несуществующая в русском языке буква – перевёрнутая П.

Следующий текст гласит: Драгоценные гости, ценные вещи в номере просьба не оставлять, пользуйтесь сейфом и он бесплатный. Спасибо.

Шотладская копчёная лососина

“Заячья шерсть” превратилась в “эаяця щестья”, а затем, видимо опираясь уже на этот “перевод” – в “оояця wopoтья”

Одним из признаков иностранного просхождения надписи является восприятие двух частей одной буквы, как двух разных, обычно это буква “Ы”, которая некоторыми иностранцами воспринимается как дифтонг или диграф. Поэтому бывают случаи, когда палочка от Ы пишется отдельно.

Образец 10. Неправильная кодировка. При наборе текстов на компьютере может возникнуть ошибка с кодировкой, в результате обычные буквы отобразятся неправильно. В первом примере отправитель бандероли (француз) без всяких подозрений написал от руки текст в неправильной кодировке. Второй пример – надпись СПЕЦТРАНС.

Автомагистраль. Табличка из московской автошколы.

Слетевшая кодировка не реализует принципы 1 и 2.

DAVID CRONENBERG, написанный одной из кодировок (возможно, dworak). Как видим, русского звучания не даёт.

Образец 11. Текст на русском без любого соблюдения грамматики, грубо нарушается третий принцип, благодаря чему текст понимается, но вызывает улыбку.

Образец 12. Электронный перевод. Часто встречается в силу своей простоты и дешевизны, однако легко узнаваем по типичным ошибкам, иностранным калькам. На русский язык обычно переводят с английского, поэтому в примерах угадывается английская грамматика и фразеология. Что бы узнать приходи на в нашу школу и изучай английский по доступной цене. Яркий пример: функция телефона “Ясные печенья” вместо “Clear cookies” Примеры реализуют пункт 2б,

Мальчиков являемся игрушки = Boys are toys
Секс-горшок = sex-pot (жарг. привлекательная девушка)
Немой = mute (подобная калька проникла даже в фильм “Армагеддон”;)
Власть = power (кнопка включения)

Нефтяная зажигалка (нефть и масло по-английски оба пишутся как oil), дым иструмент = прибор для курения

Болице – с учётом японской фонетики (а автор картиинки – японец) Полиция. Милизиа = милиция

Ошибки, вводящие в заблуждение самых незащищённых в плане языка – детей проникают на алфавитные кубики, где в результате перевода с китайского на английский и с английского на русский рождаются слова-монстры, и буквы иногда даже им не соответствуют.

Ладонь кокоса – это “кокосовая пальма”, превод с английского “coconut palm”, слово Palm означает как пальму, так и ладонь: следы электронного перевода или ручного перевода со словарём налицо. Таблица – это перевод с китайского, и часы, и таблица по-китайски одинаково звучит “бяо”. Словом “юнга” перевели, должно быть слово “youth”(молодость, молодёжь). Плодовощ – это по идее “фрукт”.

Спайдер – это явно “паук” на английском. Соответствие же этих двух картинок остаётся загадкой:

Прникают неточности и на чашки:

Козёл вместо козерога.

Телец вместо девы.

Бывают и такие вывески:

Труднее, если в электронных переводах допущена ошибка:

Победа или смерть

Имеется в виду Черненко. Здесь написано Черэнинко, в других рисунках того же автора фамилия изменяется до Цхерэнинко

Образец 13.

В тексте использованы как буквы кириллицы, так и заменющие ее буквы, цифры, знаки препинания и символы, частично реализован пункт 1, затруднен пункт 2

Наша фирма имеет 108 быстроходные швейные машины, Все поток по точне производство весь год производятся главные нижние (ночные? нужные?) рубашки.

И можно (модно?) в соответствии покупательские спроса производятся разнородные одежда.

Тинин, № 49, рынок «Ун», и Дом 29 №1, рынок «Фуртосы»

Наша фирма (отрезала? отречели? отделы?) некоммерческое отделение. Сердечно приветствую Вас, новый и старый (деление? лечение? печение?) Милости просим.

Итохуи утуан минЮ компания с органиченной ответственностью швейная «(нан ни ро ху?)»

Итак, если текс на русском не понятен, можно дать следующие рекоммендации:

  1. Прочитать его, принимая во внимание разночтение похожих букв в кириллице, латинице или греческом.
  2. Попытаться набрать слова на клавиатуре, используя другую раскладку.
  3. Найти соответствие в таблице кодировок.
  4. Мысленно перевести текст на язык автора текста или оригинала.
  5. Попытаться найти в тексте закономерности замен или типичные для текста ошибки.

Проанализировав все образцы можно заявить, что текст является русским до тех пор, пока он понятен его носителям.

И, напоследок, пример обратного рода, найденный студентом записавшимся на практический онлайн курс английского. Русский текст, переведённый электронным переводчиком, с ошибками и неправильными заменами. Например, как понять, что соус «swept away» (англ. «выметенный») на самом деле «сметанный». А «Sung Chalk» («спетый мел»), на самом деле название сигарет Pall Mall, которые непонятно с каким акцентом электронный переводчик перевёл с фразы «Пэл Мэл» (мол, «пел мел»).Has sung in jack — это пЕрепел в гнезде. Однако переводчик сделал кальку со слова «перепЕл»[песню], а Jack — это действительно «гнездо», но не птичье, а техническое, для антенны, например. «Вина Франции» в меню перевели фразой «Blame to France», означающей «винА Франции». Очень часто говяжий язык заменяется словом «language», обозначающем не часть тела, а лингвистическую единицу.Так же нередко привычное русским сокращение «в асс» (в ассортименте) переводят на английский как «in ass» (в задницу).Соус острый, пройдя через горе-переводчиков становится не пряным (hot/spicy), а «колющим» (sharp), “джин” (напиток) стал джинном (духом). Марка сигарет “Ява” была переведена как “show”, по аналогии со словом “явить”.

Пример смешения графем на продуктах российского производства. Слово, читается “ехотик”, так все буквы, включая “И” – русские, но должно по идее произноситься “экзотик”.

Приходите к нам на курс бизнес английского онлайн.

Искусственный интеллект обучили «читать» русскую пропись — Будущее на vc.ru

{“id”:13830,”url”:”\/distributions\/13830\/click?bit=1&hash=4878b89b224bb086575c116ea9b6933b6e694a2c5e92428b4e5a61e6cb77066c”,”title”:”\u0422\u0435\u0440\u044f\u043b\u0438 \u0434\u0435\u043d\u044c\u0433\u0438 \u043f\u043e\u0441\u043b\u0435 \u0447\u044c\u0435\u0433\u043e-\u0442\u043e \u043d\u0435\u043e\u0441\u0442\u043e\u0440\u043e\u0436\u043d\u043e\u0433\u043e \u0442\u0432\u0438\u0442\u0430? \u0414\u0435\u0440\u0436\u0438\u0442\u0435 \u0430\u0447\u0438\u0432\u043a\u0443″,”buttonText”:”\u0417\u0430\u0431\u0440\u0430\u0442\u044c”,”imageUuid”:”d39d5c7e-92a7-5f71-b18c-a43719ac9a4e”,”isPaidAndBannersEnabled”:false}

Российские исследователи искусственного интеллекта разработали новую сверточную нейросеть (CNN), способную распознавать изображения рукописных букв русского алфавита с точностью 99%. Работа выполнена специалистами подведомственных Минобрнауки России Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ».

563 просмотров

Нейросеть способна распознавать изображения рукописных букв русского алфавита с точностью 99%

Разработка с высокой точностью распознает текст, написанный кириллицей от руки, независимо от почерка, что само по себе трудно даже для человека. Кроме того, приложение, созданное под эту нейросеть, защищено от утечки информации, не требует подключения к Интернету и надежно с точки зрения конфиденциальности и безопасности пользователя.

С развитием IT-технологий растет важность быстрого и качественного преобразования рукописного текста в цифровую печатную версию, чтобы было удобнее копировать, редактировать или извлекать из него данные. Целью нашего исследования было распознавание рукописного текста на русском языке нейросетью с использованием моделей глубокого обучения (DL). Насколько нам известно, это первая в мире работа такого рода.

студент Института информационных и космических технологий

СФУ Андрей Левков.

Обучение нейросети проводилось с помощью предварительно обработанных данных хранилища CoMNIST — это известная база данных, содержащая образцы рукописного написания букв на латинице и кириллице. Сначала ученые построили новый набор данных с помеченным изображением для 33 букв российского алфавита. Затем разработали новую архитектуру CNN для обнаружения рукописных букв российского алфавита и сравнили ее с уже существующими мощными моделями CNN. После этого представили полное описание сверточной нейросети и исходного кода, чтобы другие исследователи могли воспроизвести эти данные. Для программирования был выбран язык Python и интерактивная среда разработки Jupyter.

Набор данных для анализа содержал 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы

Набор данных содержит 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *