Единое окно доступа к образовательным ресурсам

Десятая конференция разработчиков свободных программ: Тезисы докладов

Голосов: 0

В книге собраны тезисы докладов, одобренных Программным комитетом десятой конференции разработчиков свободных программ, которая прошла в городе Калуге 20-22 сентября 2013 года.

Приведенный ниже текст получен путем автоматического извлечения из оригинального PDF-документа и предназначен для предварительного просмотра.
Изображения (картинки, формулы, графики) отсутствуют.
                                                                    81


тельные женского рода. Предлагает исправить первое слово на обе,
обеих, обеим, обеими.
<rulegroup default="on" id="Oba_obe" name="Числительные оба/обе">
  <rule>
    <pattern>
      <token regexp="yes">оба|обоих|обоим|обоими</token>
      <token postag="NN:Fem:.*" postag_regexp="yes">
      <exception negate_pos="yes"
                 postag="NN:Fem:.*"
                 postag_regexp="yes">
      </exception>
      </token>
    </pattern>
    <message>Числительное оба (обоих, обоим, обоими) употребляется
             только с существительными мужского рода:
    <suggestion>
      <match no="1" postag="Num:.*:(.*)"
             postag_regexp="yes"
             postag_replace="Num:Fem:$1">
      </match>
      <match no="2"></match>
    </suggestion>.
    </message>
    <url>http://ru.wikipedia.org/wiki/Собирательное_числительное
    </url>
    <short>Грамматическая ошибка.</short>
    <example type="correct">По обеим сторонам.</example>
    <example type="incorrect">По <marker>обоим сторонам</marker>.
    </example>
  </rule>
</rulegroup>
   Рассмотрим структуру правил. Правила делятся на категории
(элемент category), группы правил (элемент rulegroup), и правила
(элемент rule). Далее идёт уже описание конкретного правила. Меж-
ду элементами pattern включена искомая фраза. Элементы token
включают в себя конкретное слово или знак препинания. Элемент
regexp = ”yes” означает, что используется регулярное выражение,
postag задаёт части речи, postag_regexp = ”yes” в описании частей
речи используются регулярные выражения. Тег message содержит со-
общение, которое выводится пользователю программы. Между тега-
ми suggestion представлен вариант исправления. Элемент match no =


82                                                           Вне программы


”1” означает подстановку первого слова из искомого шаблона. Эле-
менты short описывают сообщение, выводящееся в контекстном ме-
ню OpenOffice.org. Элементы example содержат контрольный пример.
Этих элементов может быть несколько. Элемент regexp = ”yes” озна-
чает, что используется регулярное выражение. Элемент postag_replace
задает словоформу, в которую нужно преобразовать искомое слово.
Элемент url содержит адрес в сети Интернет, где размещена странич-
ка с описанием грамматической ошибки.
    В настоящее время в состав LanguageTool входит 227 правил для
проверки русскоязычных текстов, с помощью которых можно обна-
ружить ошибки различных типов: грамматические, стилистические,
пунктуационные, логические, употребление заглавных букв. Таким
образом, программа может найти ошибки, которые не может обнару-
жить коммерческое программное обеспечение.
    В докладе было показано, что можно только на основе свободно-
го программного обеспечения создать полнофункциональную систему
проверки текста.

Литература
[1] Naber Daniel, A Rule-Based Style and Grammar Checker, Diplomarbeit,
    Universit¨t Bielefeld, Bielefeld, 2003
             a
[2] Marcin Milkowski, Developing an open-source, rule-based proofreading tool,
    Software – Practice and Experience, 2010
[3] Jaroslaw Lipski, Marcin Milkowski, Using SRX standard for sentence
    segmentation in LanguageTool, in: Z. Vetulani (ed.), Human Language
    Technologies as a Challenge for Computer Science and Linguistics,
    Wydawnictwo Pozna´skie, Fundacja Uniwersytetu im. A. Mickiewicza,
                       n
    Pozna´, 2009
          n



    
Яндекс цитирования Яндекс.Метрика