Microsoft Word 2016 и синтаксический контроль Текст научной статьи по специальности «Языкознание и литературоведение»
Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лавошникова Элина Константиновна
Разбирается работа версий автокорректора ( спеллера ) Microsoft Word 2016 и MS Word 2013 с ошибками согласования слов во фразах. На примерах показано, что при компьютерной проверке русскоязычных текстов правила синтаксиса учитываются далеко не в полной мере и что перегруженность Word’овских системных словарей малоупотребительной лексикой приводит к пропуску не только орфографических ошибок, но и ошибок в построении фраз. Предлагается дополнять текстовый редактор списками словосочетаний и фразеологизмов с наиболее «популярными» ошибками, не выявляемыми системой, и информацией об их правильном написании для выдачи пользователю Интернета рекомендаций по исправлению согласования слов в проверяемом тексте.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Лавошникова Элина Константиновна
«Проблемные» слова как причина пропуска ошибок при компьютерной проверке орфографии
Microsoft Word и причины пропуска ошибок
Word и малоупотребительная лексика в словарях текстового редактора
Вариативность в грамматике стихотворных текстов и их компьютерная коррекция (на материале антологии «Поэзия Московского университета: от Ломоносова и до. . . »)
Архаизмы и компьютерная проверка правописания (на материале антологии «Поэзия Московского университета: от Ломоносова и до. . . «)
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.
Текст научной работы на тему «Microsoft Word 2016 и синтаксический контроль»
Московский государственный университет им. М. В. Ломоносова, Научно-исследовательский
вычислительный центр, г. Москва, Россия
MICROSOFT WORD 2016 И СИНТАКСИЧЕСКИЙ КОНТРОЛЬ
Разбирается работа версий автокорректора (спеллера) Microsoft Word 2016 и MS Word 2013 с ошибками согласования слов во фразах. На примерах показано, что при компьютерной проверке русскоязычных текстов правила синтаксиса учитываются далеко не в полной мере и что перегруженность Word’овских системных словарей малоупотребительной лексикой приводит к пропуску не только орфографических ошибок, но и ошибок в построении фраз. Предлагается дополнять текстовый редактор списками словосочетаний и фразеологизмов с наиболее «популярными» ошибками, не выявляемыми системой, и информацией об их правильном написании — для выдачи пользователю Интернета рекомендаций по исправлению согласования слов в проверяемом тексте.
Microsoft Word; Word 2016; компьютерная коррекция правописания; синтаксические ошибки; фразеология; синтагма; синтаксис; текстовый редактор; спеллер.
Lomonosov Moscow State University, Research Computing Center, Moscow, Russia MICROSOFT WORD 2016 AND SYNTAX VERIFICATION
This article considers how Microsoft Word®’s built-in spell-checking tools (versions 2013 and 2016) process word disagreement in sentences. It demonstrates that computer-aided checking of Russian language texts does not always follow syntax rules; moreover, preinstalled vocabularies feature many rare or obsolete words, which leads not only to omission of spelling mistakes but also to incorrect word concord in phrases. Author proposes to supplement editor’s vocabularies with a list of commonly used word combinations and idioms containing the most «popular» errors, which are usually not detected by spell checker, as well as with information about their correct spelling to provide recommendations on how to make words in a sentence agree properly.
Microsoft Word; Word 2016; computer spelling correction; syntactic mistakes; phraseology; syntagma; syntax; text editor; spellchecker.
В книге, содержащеи ровно 256 страниц, Ирина Спира сетует: «Традиционная проверка правописания была реализована в Microsoft Word на высоком уровне. Программа замечала не только орфографические ошибки, но и «чувствовала» весьма тонкие грамматические и стилистические нюансы, решала даже непростые пунктуационные задачи. Но в Microsoft Word 2013 качество проверки правописания русского текста заметно ухудшилось» [14, с. 59].
Приведем пример. В некоторых предыдущих версиях Word^ (основанных на системе ОРФО) подсказка выдавала рекомендацию по нормативному слитному написанию слова невтерпёж. Но текстовыи редактор Word 2013 (а также и Word 2016) последовательность с пробелами «не в терпеж», иногда встречающуюся в текстах пользователеи Интернета, уже не предлагает склеивать.
Справедливости ради следует заметить, что многие огрехи, которые мы и другие пользователи Интернета отмечали, в системе Word 2013 уже были устранены, но к синтаксическому анализу по-прежнему остается много вопросов. И даже в наиболее разработанном направлении -выявлении орфографических ошибок — в текстовом редакторе Word 2013 (это относится и к Word 2016) остается немало разного рода недочетов.
Реакция Word^ на неправильно построенные фразы
При компьютерной проверке правописания в текстовом редакторе MS Word автокорректор красной волнистой линией подчеркивает слова (или части слов при написании через дефис), отсутствующие или не порождаемые в Word’овских внутренних системных словарях.
Синей волнистой линией система Word 2016, как и Word 2013, в текстах пользователя подчеркивает предполагаемые синтаксические огрехи — ошибки в согласовании и сочетаемости слов во фразе. В более ранних версиях, разработанных на основе системы «Орфо», такие фрагменты текста подчеркивались зеленой волнистои линиеи.
Неправильно построенные фразы далее в наших примерах отмечены астериском (звездочкой). Подчеркиваемые системои Word 2016 слова и словосочетания (синеи или краснои волнистои чертои) мы в наших примерах тоже будем ПОДЧЕРКИВАТЬ.
Приведем примеры работы текстового редактора Word последних версии. Разберем предложение, в котором пропущены две запятые (к сожалению, пользователи часто ленятся проставлять все знаки препинания). *Отзывы присланные в последние дни не учтены. Подсказка предупреждает о пропуске только первой запятой в причастном обороте. После проставления пользователем этои запятои вторую (после причастного оборота «присланные в последние дни») Word’овская программа-подсказка не предлагает.
Слово например в середине фразы — и не только — система Word 2016 (так же, как и Word 2013) всегда предлагает окружать запятыми. Например: синеи волнистои линиеи подчеркивается первое вхождение слова например в данном предложении (не предусмотрена возможность двоеточия). А если слово «например» заключено в кавычки, то подсказка Word^ предлагает поставить запятую с пробелом впритык к открывающей кавычке и сделать окруженное кавычками с двумя запятыми и одним пробелом «, например,»! Такую конструкцию с грубои пунктуационнои ошибкои текстовыи редактор Word последних версии пропускает без замечании как правильную.
Можно предположить, что Word 2016 так же обращается и с другими вводными словами. Проверим на примере. Он сказал: «Следовательно, они не первые». Подсказка опять предлагает вставить запятую после открывающей кавычки.
Программа-подсказка Word’овского спеллера иногда требует запятую перед «как» вопреки правилам русскои грамматики. Пример: Как же это исправить? *Не знаю как. Во второи фразе -синее подчеркивание. Согласно правилам пунктуации, однако, не ставится запятая между главным и следующим за ним придаточным предложением, «если придаточная часть состоит из одного союзного слова» [12, с. 141].
Ниже еще несколько примеров вордовскои гипердиагностики.
Вы знаете этого человека? В этои фразе получаем синее подчеркивание первых двух слов. Программа-подсказка Word^ предлагает запятую после слова знаете, которое далеко не во всех контекстах используется как вводное.
Они не хотят штурмовать горы, путь к вершинам которых слишком труден. Опять синее подчеркивание в правильно построенном предложении. Подсказка Ворда, похоже, всегда требует запятую перед словом «которыи» в разных его формах.
Отложим на параллельных прямых отрезки длиной 1 см. Системная программа-подсказка выдает «исправление» — «на_параллельные прямые отрезки». То есть не учитывается, что слово прямая может выступать в функции существительного.
Текстовыи редактор Word 2016 (как и Word 2013) подчеркивает красным написание «суперЭВМ» и предлагает в своеи подсказке два варианта: дефисныи «супер-эвм» и слитныи, но только строчными буквами — «суперэвм». Однако в академических словарях мы находим словарную статью суперЭВМ, в том числе в орфографическом словаре Букчинои, Сазоновои и Чельцовои [2], включенном наряду с грамматическим словарем Зализняка [4] в список четырех словареи, грамматик и справочников, рекомендованных в 2009 году Межведомственнои комиссиеи по русскому языку при Минобрнауки и содержащих нормы современного русского литературного языка.
Примеры неправильно построенных фраз, пропускаемых Word’ом
Далее приводятся специально сконструированные предложения с ошибками и опечатками (в том числе с разбиениями или склеиваниями слов), помеченные звездочкои. Согласование слов нарушено, однако Word 2016 не замечает в этих примерах синтаксических ошибок. Нет подчеркивании ни красной, ни синей волнистои линиеи. Подобные фразы могут быть использованы при тестировании других версии Word^ — как предыдущих, так и последующих.
*Кто научились вышивать? *Два девочки сделали подарки для своей мать. *Вы не согласен?
Наши эмигранты (из числа подзабывших русскии язык) или иностранцы могут делать подобные ошибки. Однако система Word 2016 пропускает подобные фразы без замечании. Исключительно часто у пишущих встречаются ошибки на -ться/-тся: *Не хочу учится, а хочу женится! *Он жениться. Word 2016 (как и Word 2013) в обеих фразах ничего не подчеркивает, хотя даже в версии 2000-го года по поводу первои фразы «подсказка ОРФО высказала свои сомнения» (это цитата из статьи [8, с. 32]).
Так же часто можно видеть букву «и» вместо «е» в окончании личнои глагольнои формы: *Если вы вырвите эту фразу из контекста, то пол учится черти-что. *Комму Вы это пишите? *Что Вы ищите на суще? (Литеры «ш» и «щ» иногда по ошибке заменяют друг друга.) Текстовыи редактор Word 2016 ничего не подчеркивает, хотя вся структура или вопросительныи знак в конце двух последних фраз указывают на то, что здесь не должно быть повелительного наклонения. Кроме того, в первои фразе имеется ошибочное, но часто встречающееся написание «черти-что» вместо нормативного черт-те что (см. словари [2, 13]). Во второи фразе мы видим удвоение согласнои в местоимении «кому», которое спеллер не замечает из-за присутствия в его системном словаре существительного комма (музыкальныи термин).
Нередко отрицание «не» заменяет у пишущих частицу «ни»: *Кс тати, кс-лову сказать, не одного студента, который бы держал конспект подмышкой, мы не видели. (Здесь требуется раздельное написание: под мышкой.) *Не в коем случае не надо делать ее взрос лее. Нет никакои реакции на ошибки от системы Word 2016. В системном словаре, как мы убеждаемся на этих примерах, имеется устаревшее существительное тать, глагол взрасти, низкочастотное лей (денежная единица) и неологизм кс (игра).
Иногда в речи и на письме числительное «обе» в процессе «упрощения» заменяется на «оба» (но встречается и обратная замена). *Каждый лень иди вечер я пользуюсь обеими шампунями. *Ближе к ввечеру, когда спрос упад, шли обще городские про верки на обоих ярмарках, не исключая и контрольную закуп ку. *Собрали большой материл. В этих фразах спеллер не заметил разбиении слов из-за включения в систему сомнительнои формы «обще», отсутствующеи как отдельное слово в академических словарях, «ку» и низкочастотного существительного «верки». В результате нередко случающегося ошибочного нажатия литеры «д» вместо соседнеи «л» на клавиатуре может получиться «упад», внесенныи в вордовскии системныи словарь с полнои парадигмои («упадом», «упады», «упадами» и т.д.) из выражения «до упаду», а также императив «иди». В первои фразе несоответствие формы мужского рода каждый и существительного женского рода («лень») Word 2016 тоже не замечает, как и другие огрехи в приведенных фразах-примерах. *Нас не нужно водить заручку. *Но в течении последних дней мы не прятались друг задруга, в отличии от плотни ков. По отсутствию подчеркивании мы видим, что в системном словаре Word^ находятся низкочастотные существительные заручка и задруга (‘маленькое общество’), глагол плотнить и устаревшее ковы. При наличии после синтагмы «в течении» указания на временнои промежуток программа-подсказка могла бы выдавать пользователю Интернета исправление «в течение». При разборе тои же фразы система могла бы рекомендовать «в отличие от» как более вероятное из двух возможных написании. *Заграницей я не вар ю бор щ. Здесь мы видим весьма частое употребление творительного падежа от существительного заграница вместо нормативного раздельного написания «за границеи». Заметим также, что любые одиночные буквы в текстовом редакторе Word (версии 2013 и 2016) пропускаются без подчеркивания.
*Втору ю вы плату они уреза ют в виду новой инструкции. *Если то, что семейство нара стило,уду маешь розбить на части, то имей это ввиду! *Ждав, чтобы сумму взыск али скак можно меньшими накрутка ми, они про считались. В первых двух фразах требуется поменять местами написание «в виду» и слитное «ввиду», которые часто путают. Очевидно, что из выражения «на скаку» в словаре Word^ получилась парадигма: скак, скаком, скаков и т.д. Словоформа «нара» относится к существительному «нар (животное)» [13]. В словаре Зализняка к глаголу ждать дано указание «деепр. затрудн.» [4]. В приведенных фразах имеются и другие ошибки (разбиение пробелом словоформы «выплату», предлог «про» перед глаголом и др.), на которые текстовыи редактор Word 2016 тоже не реагирует. *Любимец воспитатель ниц вы спался, лежав гамаке. *Он треб овал до стать к ужну клюк венное варенье, но не розбить при этом ваз очку. Глагол спаться в словаре [4] снабжен пометои «безл.». Его мы встречаем только в контекстах «мне не спится», «ему не спалось» и т.п. При склеивании деепричастия «лежа» с предлогом получилось отсутствующее в [4] деепричастие лежав, которое, тем не менее, порождается в Word’овских системных
словарях. Во второи фразе при пропуске гласнои в синтагме «к ужину» получилась форма от глагола «ужать — ужинать» (посеянное). Устаревшее существительное «ре)збить» [15] не включено даже в представительным современным словарь [13], но в вордовском системном словаре еще остается.
*Нано-технология край не эф-фиктивна. *Эта нанотехнология зане сет нас в не ведомое. Первая фраза пропускается без замечании, хотя в неи есть ошибки. В частности, вместо слова эффективна мы видим дефисное разбиение (весьма частыи огрех — по техническим причинам), а также грубую орфографическую ошибку. В результате получилось сочленение словоформы «эф» (название буквы или падежная форма множественного числа от слова «эфа» со значением ‘змея’) с краткои формои прилагательного фиктивный. Во втором предложении краснои волнистои линиеи подчеркивается слово нанотехнология, не внесенное пока еще в Word’овский системным словарь. (Подсказка, как обычно, предлагает разбить это слово на два: «нано технология».) При этом системныи словарь содержит большие запасы устаревшеи лексики, в том числе союз «зане», получившиися во второи фразе при разбивке пробелом глагольнои формы занесет.
Желательно было бы удалить или временно — до улучшения ситуации с проверкои синтаксиса — заблокировать в Word’овских системных словарях некоторые малоупотребительные слова, такие как: ввечеру, али; существительные закуп, втора, задруга, стило, уд, розбить, взыск; глаголы взрасти и маять (слова взяты из наших фраз-примеров, см. выше).
Другие примеры некорректных фраз и синтагм (словосочетании) со специально подобранными ошибками согласования, управления и примыкания для тестирования работы автокорректоров приведены в наших работах [6, 7] и в более ранних — например, в статье [9].
О перегруженности внутренних системных словареи автокорректоров низкочастотнои и устаревшеи лексикои мы писали в статьях [5, 8] и др.
Можно также привести примеры, когда некоторые имена собственные, внесенные в последние версии Word% при слабом синтаксическом контроле мешают выявлению слов с ошибками. Допустим, в текстах имеются такие фразы с ошибочным пропуском буквы: *Даная статья уже опубликована; *Стрые варианты не годятся. Однако эти опечатки в словах, написанных с прописнои буквы, не будут замечены Вордом-2013 и Вордом-2016, поскольку в системе содержатся имя Даная и топоним Стрый (‘река, город’) [5, с. 472].
В словаре Ушакова выражение «в пику» было дано в слитном написании (впику) [15], а вводное «должно быть» — через дефис, но эти нормы устарели. Однако написание должно-быть Word 2016 пропускает без подчеркивания, как и многие ошибочные дефисные образования.
Разумеется, язык развивается, нормы меняются. Приведем пример из статьи Маии Владимировны Всеволодовои: «Так, в соответствии с нормои предлог по в значении ‘после’ управляет предложным падежом. <. >В настоящее время не только все студенты-москвичи, но и ведущие наших телепрограмм, журналисты системно употребляют с экрана и в печати словоформы по приезду, по прилёту (президента), по приходу (поезда), хотя никто пока старои нормы не отменял» [3, с. 31].
Справедливости ради следует отметить, что не только разработчики Word^ иногда вступают в противоречие с рекомендациями современных академических словареи и справочников. Владимир Кузьмич Лебедев в статье с названием, перефразирующим знаменитую фразу с пропущеннои запятои «Казнить нельзя помиловать», наряду с другими приводит такои пример: «. одни издательства продолжают следовать рекомендации ВАК и Госстандарта 2003 и слово «диссертация» сокращают как «дис.», другие исходят из разъяснении «Правил. «, согласно которым в графических сокращениях двоиные согласные корня перед точкои сохраняются» [10, с. 36]. Далее автор заявляет: «Пока настоящие ученые не могут приити к единому мнению, издание словареи и справочников стало коммерческими проектами, они пекутся как блины, во многих из них бесчисленное количество ошибок и опечаток. И этому необходимо противостоять» [Там же, с. 37].
Еще один пример — цитата из статьи Владимира Владимировича Лопатина: «Год назад в принятои Госдумои законе утверждены написания паралимпийский и сурдлимпийский (притом что до этого в русском языке слова эти установились в нормальном написании — параолимпийский и сурдоолимпийский). Олимпиада превратилась таким образом в Лимпиаду, что недопустимо по всем законам словообразования, по краинеи мере русского. Авторы закона (во главе с г. Грызловым) ссылаются на англииские написания этих слов, принятые Международным Олимпииским комитетом и, в общем-то, вызывающие не меньшее удивление» [11, с. 142].
Предложения по усовершенствованию синтаксического контроля
По поводу фразеологических оборотов можно привести цитату из статьи А.Е. Азимова и Елены Игоревны Большаковои: «Большая часть допустимых словосочетании относится к нестандартнои (идиоматическои) сочетаемости, т.е. при изменении в таком словосочетании одного слова на другое, с близким или тем же смыслом, получается сочетание, в этом языке практически не употребляемое. Поэтому для каждого ЕЯ лексическая сочетаемость определяется не правилами, а фиксируется специальными словарями устоичивых словосочетании <. >, которые в то же время не могут охватить все допустимые словосочетания из-за их большого числа» [1, с. 78].
Мы предлагаем дополнять компьютерные системные словари списками наиболее вероятных и часто встречающихся искажений слов и синтагм с их исправленными вариантами. Конечно, для некоторых первых компонентов этих пар можно придумать фразы, в которых они грамматически обоснованы. Но это будут искусственные и маловероятные примеры. Список рекомендованных исправлении мог бы состоять из пар наподобие следующих: , , , , , , ,
(Word 2016 допускает оба варианта, но слитное написание было нормативным только до 1956 года; а вот современная цитата из Интернета: «Общество слабовидящих приглашает на работу секретаршу до 30 лет, приятную на ощупь»), , ,
(«ни» в узусе часто вытесняется отрицательнои частицеи «не»; кроме того, в этом фразеологизме запятая не нужна — вопреки рекомендации программы-подсказки системы Word 2016 и синему подчеркиванию), ,
(второи вариант в реальных контекстах по смыслу гораздо более вероятен, хотя можно придумать с натяжкой пример, в котором первыи вариант тоже вполне нормативен: «По завершению и финалу этого мероприятия нельзя судить о его первых днях»),
(пишется с предлогом слитно; запятая не нужна — вопреки синему подчеркиванию и рекомендации подсказки текстового редактора Word 2016, см. словарь [13]),
Списки с другими примерами некорректных словосочетании с их исправлениями, которые тоже могли бы быть использованы в новых версиях спеллеров, приведены в наших статьях [6] и [7].
Очевидно, что множество самых частотных примеров — даже с их вариациями (по падежам и т.п.) — не бесконечно, а вполне обозримо.
Подобные приведенному выше перечни «популярных» в текстах пользователеи Интернета ошибочных фрагментов с их исправленным написанием призваны способствовать более эффективнои работе текстового редактора при компьютернои проверке правильности написания фразеологизмов и других словосочетании.
1. Азимов А.Е., Большакова Е.И. Подход к автоматической коррекции ошибок сочетаемости слов в текстах на естественном языке // Новые информационные технологии в автоматизированных системах. — 2011. — № 14. -С. 78-91.
2. Букчина Б.З., Сазонова И.К., Чельцова Л.К. Орфографический словарь русского языка. — 4-е изд., испр. — М.: АСТ-ПРЕСС КНИГА, 2008. — 1296 с. (Настольные словари русского языка).
3. Всеволодова М.В. Система морфосинтаксических типов русских предлогов // Вестник Московского ун-та. Серия 9: Филология. — 2012. — № 5. — С. 30-78.
4. Зализняк А.А. Грамматический словарь русского языка: Словоизменение. Ок. 110 000 слов. — Изд. 6-е, стер. — М.: АКТ-ПРЕСС КНИГА, 2010. — 800 с. (Фундаментальные словари).
5. Лавошникова Э.К. Microsoft Word и причины пропуска ошибок // Современные информационные технологии и ИТ-образование. — 2015. — Т. 1, № 11. — С. 471-476.
6. Лавошникова Э.К. MS Word и синтаксические ошибки // Актуальные проблемы гуманитарных и естественных наук. — 2016. — № 8 (91). — С. 74-77.
7. Лавошникова Э.К. Word: О компьютерной проверке синтаксических конструкций // Science Time. — 2016. -№ 5 (29). — С. 374-380.
8. Лавошникова Э.К. О компьютерной коррекции «популярных» ошибок в текстах на русском языке // Научно-техническая информация. Серия 2. «Информационные процессы и системы». — 2003. — № 9. — С. 28-34.
9. Лавошникова Э.К. О компьютерной проверке синтаксических конструкций в текстах на русском языке // Информационные процессы. — 2005. — Т. 5, № 3. — С. 201-212.
10. Лебедев В.К. Отложить нельзя договориться // Мир русского слова. — 2008. — № 4. — С. 35-37.
11. Лопатин В.В. Проблемы информативности орфографического словаря // сб. Вопросы культуры речи (ред. А.Д. Шмелев). — М., 2012. — С. 139-143.
12. Розенталь Д.Э. Справочник по русскому языку. Пунктуация. — М.: Издательский дом «ОНИКС 21 век», 2003. — 264 с.
13. Русский орфографический словарь: ок. 200 000 слов / Под ред. В.В. Лопатина, О.Е. Ивановой. — Изд. 4-е, испр. и доп. -М.: АСТ-ПРЕСС КНИГА, 2015. — 896 с.
14. Спира И. Microsoft Excel и Word 2013: Учиться никогда не поздно. — СПб: Питер, 2014. — 256 с.
15. Толковый словарь русского языка (под ред. Д.Н. Ушакова). — М., в 4-х томах, 1935-1940.
1. Azimov A.E., Bol’shakova E.I. Podhod k avtomaticheskoj korrekcii oshibok sochetaemosti slov v tekstah na estestvennom jazyke // Novye informacionnye tehnologii v avtomatizirovannyh sistemah. — 2011. — № 14. — S. 78-91.
2. Bukchina B.Z., Sazonova I.K., Chel’cova L.K. Orfograficheskij slovar’ russkogo jazyka. — 4-e izd., ispr. — M.: AST-PRESS KNIGA, 2008. — 1296 s. (Nastol’nye slovari russkogo jazyka).
3. Vsevolodova M.V. Sistema morfosintaksicheskih tipov russkih predlogov // Vestnik Moskovskogo un-ta. Serija 9: Filologija. — 2012. — № 5. — S. 30-78.
4. Zaliznjak A.A. Grammaticheskij slovar’ russkogo jazyka: Slovoizmenenie. Ok. 110 000 slov. — Izd. 6-e, ster. — M.: AKT-PRESS KNIGA, 2010. — 800 s. (Fundamental’nye slovari).
5. Lavoshnikova Je.K. Microsoft Word i prichiny propuska oshibok // Sovremennye informacionnye tehnologii i IT-obrazovanie. — 2015. — T. 1, № 11. — S. 471-476.
6. Lavoshnikova Je.K. MS Word i sintaksicheskie oshibki // Aktual’nye problemy gumanitarnyh i estestvennyh nauk. — 2016. -№ 8 (91). — S. 74-77.
7. Lavoshnikova Je.K. Word: O komp’juternoj proverke sintaksicheskih konstrukcij // Science Time. — 2016. — № 5 (29). -S. 374-380.
8. Lavoshnikova Je.K. O komp’juternoj korrekcii «populjarnyh» oshibok v tekstah na russkom jazyke // Nauchno-tehnicheskaja informacija. Serija 2. «Informacionnye processy i sistemy». — 2003. — № 9. — S. 28-34.
9. Lavoshnikova Je.K. O komp’juternoj proverke sintaksicheskih konstrukcij v tekstah na russkom jazyke // Informacionnye processy. — 2005. — T. 5, № 3. — S. 201-212.
10. Lebedev V.K. Otlozhit’ nel’zja dogovorit’sja // Mir russkogo slova. — 2008. — № 4. — S. 35-37.
11. Lopatin V.V. Problemy informativnosti orfograficheskogo slovarja // sb. Voprosy kul’tury rechi (red. A.D. Shmelev). — M., 2012. — S. 139-143.
12. Rozental’ D.Je. Spravochnik po russkomu jazyku. Punktuacija. — M.: Izdatel’skij dom «ONIKS 21 vek», 2003. — 264 s.
13. Russkij orfograficheskij slovar’: ok. 200 000 slov / Pod red. V.V. Lopatina, O.E. Ivanovoj. — Izd. 4-e, ispr. i dop. — M.: ASTPRESS KNIGA, 2015. — 896 s.
14. Spira I. Microsoft Excel i Word 2013: Uchit’sja nikogda ne pozdno. — SPb: Piter, 2014. — 256 s.
15. Tolkovyj slovar’ russkogo jazyka (pod red. D.N. Ushakova). — M., v 4-h tomah, 1935-1940.
Лавошникова Элина Константиновна, ведущии программист НИВЦ МГУ им. М.В. Ломоносова, литературныи редактор журнала «Вычислительные методы и программирование: Новые вычислительные технологии», el.lavoshnikova@yandex.ru.
Парсер — программа синтаксического контроля данных
В информатике, синтаксический анализ (парсинг) — это процесс анализа входной последовательности символов, с целью разбора грамматической структуры, обычно в соответствии с заданной формальной грамматикой. Синтаксический анализатор (парсер) — это программа или часть программы, выполняющая синтаксический анализ.
Синтаксический контроль выявляет ошибки формата обменного файла отчета организации, которые могут быть допущены, как на этапе формирования отчета организации, так и на этапе его передачи в ФИС (пропуск метки, потеря части файла в канале передачи и др.). На этапе синтаксического контроля проверяется также заполнение в отчете обязательных полей (код организации и др.), без которых невозможна дальнейшая обработка отчета.
При обнаружении ошибок на этапе синтаксического контроля отчетного файла организации, обработка отчета прекращается и для организации генерируется сообщение ФИС об ошибке формата обменного файла.
В ФИС для представления отчетных данных СНК ЗО и ОИК ЗО используется формат языка XML — well formed XML.
Каждый документ, описанный на языке XML, содержит один или более элементов, которые ограничены начальной меткой элемента и конечной меткой.
Начальная метка имеет форму<Имя>, конечная метка формуИмя>.
Документ обязательно содержит один элемент, называемый корневым, начальная и конечная метки которого не содержатся ни в одном другом элементе. Остальные элементы, ограниченные своими начальными и конечными метками, могут образовывать вложенные структуры.
Конструкция<Имя>содержание элементаИмя>применяется как к отдельным данным, так и к блокам данных, которые могут содержать отдельные данные и другие блоки данных.
Таким образом, этот формат обеспечивает представление иерархических структур данных, характерных для отчетов СНК ЗО и ОИК ЗО
Общие правила, применяемые при формировании обменного файла well formed XML:
- · В XML файле информация должна представляться в коде Windows 1251;
- · В первой строке файла должна указываться версия XML и используемая
- · кодировка. Например:
· Каждый элемент XML-подобного формата имеет вид
Разбор тестирования 1С:Профессионал и PMP
Конструкции встроенного языка имеют свои правила написания; соответственно, любое отклонение от них будет ошибкой. Например, часто встречается, что в конце строки пропущен символ точки с запятой (;). Для проверки модуля до стадии отладки можно использовать механизм синтаксического контроля. Можно воспользоваться хоткеем Crtl + F7 или соответствующим пунктом меню:
Вопрос 02.12 экзамена 1С:Профессионал по платформе. Для чего используется синтаксический контроль?
- Для проверки выделенного фрагмента модуля на правильность использования синтаксических конструкций встроенного языка
- Для проверки программных модулей на правильность использования синтаксических конструкций встроенного языка
- Нет правильного ответа
- В любой момент редактирования модуля, выбрав команду контекстного меню «Синтаксический контроль»
- При закрытии модуля
- При сохранении всей конфигурации
- В любой момент редактирования модуля, выбрав команду контекстного меню «Синтаксический контроль», а также (при включенном режиме автоматического выполнения синтаксического контроля модуля) при закрытии текста модуля или сохранении всей конфигурации
Большая Энциклопедия Нефти и Газа
Синтаксический контроль предполагает разложение входных сообщений на отдельные компоненты, проверку соответствия грамматическим правилам внутреннего представления знаний и выявление недостающих частей. Семантический анализ обеспечивает установление смысловой правильности синтаксических конструкций. В отличие от анализа синтез высказываний заключается в преобразовании цифрового представления информации в представление на естественном языке. [1]
Синтаксический контроль предполагает проверку соответствия структуры входной строки заданному синтаксису. Для рассматриваемого синтаксиса это сводится к проверке порядка следования операндов и операций во входной строке и соответствия операций заданному ( в данном варианте) набору. [2]
Синтаксический контроль языка на основе описания его грамматики осуществляется посимвольным просмотром проверяемого предложения. При обнаружении синтаксически неверной конструкции в трансляторе предусматривается останов машины, который позволяет выявлять ошибки синтаксического характера, допущенные при составлении алгоритма. [4]
Синтаксический контроль текста программы и распознавание отдельных операторов языка Фортран выполняются различными методами. В этой статье кратко рассматриваются метод таблицы структур и метод состояние — символ, а также предлагается новый метод, названный комбинированным. Реализация его в трансляторе ТФ1 для ЭВМ Мннск-32 позволила значительно ускорить распознавание и синтаксический контроль операторов по сравнению с упомянутыми выше методами. Кроме того, объем памяти, занятый соответствующей программой, также существенно сократился. [5]
Задачей синтаксического контроля является проверка входного текста на соответствие синтаксису языка, заданному в его формальном описании. Полнота синтаксического контроля определяется соответствием методов его реализации классу, к которому относится контролируемый входной язык. [6]
Ускорение синтаксического контроля при использовании этого метода возможно за счет введения дополнительных таблиц, что увеличивает объем памяти и усложняет алгоритм программы-реализующей данный метод. [8]
Задачей синтаксического контроля является проверка входного текста на соответствие синтаксису языка, заданному в его формальном описании. При таком контроле могут быть обнаружены и некоторые другие, более сложные ошибки, носящие общий для программы характер: неправильная сегментация программы, отсутствие приема и передачи управления, отсутствие необходимых характеристик переменных. Полнота синтаксического контроля определяется соответствием методов его реализации классу, к которому относится контролируемый входной язык. [10]
Блок синтаксического контроля ( блок 2) с помощью синтаксических таблиц проверяет корректность синтаксиса Алгол-программы. Информация об обнаруженных ошибках выдается на печать. Блок выделения понятий ( блок 3) переводит программу с внутреннего языка на промежуточный, в котором нет рекурсивно-сти, свойственной языку Алгол-60. Перевод выполняется с помощью таблиц. В процессе перевода из отдельных букв и цифр собираются идентификаторы, а числа переводятся в двоичную систему. Информация о неописанных идентификаторах выдается на печать. [11]
При синтаксическом контроле , основанном на бинарных отношениях, указание о характере ошибки достаточно просто может быть ограничено лишь указанием об ошибочном символе. Более полная информация достигается сложным семантическим путем. [12]
Распознавание и синтаксический контроль выполняет управляющая программа, которая использует программу чтения и две дополнительных таблицы ( см. рис. 4): таблицу ключей и таблицу ключе-вых слов операторов. Комбинированный метод заключается в следующем. По ключу путем последовательного просмотра таблицы ключей выбирается соответствующая строка, которая определяет места входов в таблицу ключевых слов операторов и в комбинированную матрицу. В связи с этим в двух последних, более сложных таблицах анализ производится только по требуемым в каждом конкретном случае частям таблиц. [13]
Далее выполняется синтаксический контроль операторов , и если, в одном из них будет обнаружена ошибка, то задание в обработку не принимается. Если все операторы синтаксически корректны, то информация, ггринадлежащая самому заданию, заносится во входную очередь заданий и в связанные блоки управления, а данные передаются на диск системного ввода В менее сложных системах, например, таких, как дисковая операционная система Siemens 4004, оператор должен запустить эту программу считывания вручную, а также выделить память для нее и задания, которое она инициирует. Более развитые системы ( IBM 360 / 370 OS, VS; ICL System-4, уровень J, Siemens 4004 BS) позволяют использовать резидентный считыва -, тель, который автоматически считывает входной поток заданий всякий раз, когда в нем есть данные, и формирует входную очередь заданий. Разумеется, для резидентного считывателя необходим большой объем основной памяти ( около 30 кбайт в противоположность 6 кбайт, необходимым для простого нерезидентного считывателя), и это, конечно, уменьшает возможности мультипрограммирования. [14]
Анализатор осуществляет синтаксический контроль текста описания . Пользуясь разделителями, он выделяет отдельные разделы текста описания и передает информацию об этом диспетчеру, который подключает соответствующие программы. [15]