Уникальные слова в файле Microsoft Word в C#

Этот пример является модификацией более раннего сообщения Перечислить уникальные слова в файле Microsoft Word на C# . Эта программа считывает слова в текстовом файле Microsoft, сортирует их, а затем отображает уникальные слова в списке.

Я иногда использую эту программу для поиска орфографических ошибок в книгах, которые я пишу. Иногда бывает трудно заметить, что Слово помешало конкретное слово как ошибочное. Я могу использовать предыдущий пример, чтобы составить список всех слов, а затем искать любые ошибки с ошибками.

Сейчас я работаю над новой книгой (я расскажу подробности в ближайшие несколько недель), и я решил изменить этот пример, чтобы сделать его более полезным. Эта версия добавляет две новые функции.

Сначала он записывает уникальные слова в файл. Затем я могу скопировать и вставить его содержимое в новый документ Microsoft Word и позволить Word проверять отдельные слова на наличие орфографических ошибок.

Во-вторых, эта версия разбивает слова, которые находятся в чехле Паскаля или на верблюжьем корпусе. Например, фрагмент кода может содержать слово «PreviwMouseDown». Этот тип опечатки особенно трудно обнаружить, поскольку Microsoft Word помещает все слова Pascal и верблюда в качестве орфографических ошибок, поэтому становится слишком легко игнорировать предупреждения. Программа разбивает это слово на «Previw Mouse Down». Теперь, когда Word помещает первую часть «Previw» в качестве ошибки, гораздо проще увидеть, что это действительно неправильно написано.

Следующий код показывает, как программа обрабатывает слова указанного файла.

Этот код использует метод GrabWordFileWords, описанный в более раннем сообщении, чтобы получить слова, содержащиеся в файле. (Подробности см. В этом сообщении.)

Далее код использует регулярное выражение для преобразования специальных символов, таких как _ и & amp; в пространства. Затем он использует метод string класса Split для разделения текста на слова, разделенные пробелами.

Затем программа использует запрос LINQ для вызова метода ToProperCase, который кратко описывается для каждого из слов. Он выбирает результат этого метода и заказывает результаты словами. (Вероятно, нужно упорядочить их ToProperCase (word), но, вероятно, это не имеет большого значения для упорядочения.)

Программа заканчивается, отображая результаты в окне списка и записывая слова в файл.

В следующем коде показан метод ToProperCase.

Этот метод создает строку результата и добавляет к ней первый символ входного слова. Затем код перебирает оставшиеся символы слова. Когда он видит заглавную букву, он добавляет пробел к результату до этой буквы. Затем код добавляет письмо к результату.

После завершения обработки букв слова метод возвращает завершенный результат.

Источник: http://csharphelper.com/blog/2017/08/examine-unique-words-microsoft-word-file-c/

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)

Add a Comment

Ваш e-mail не будет опубликован. Обязательные поля помечены *