Форум программистов
 

Восстановите пароль или Зарегистрируйтесь на форуме, о проблемах и с заказом рекламы пишите сюда - alarforum@yandex.ru, проверяйте папку спам!

Вернуться   Форум программистов > Microsoft Office и VBA программирование > Microsoft Office Word
Регистрация

Восстановить пароль
Повторная активизация e-mail

Купить рекламу на форуме - 42 тыс руб за месяц

Ответ
 
Опции темы Поиск в этой теме
Старый 02.10.2009, 02:37   #11
mykky_
 
Регистрация: 29.09.2009
Сообщений: 7
По умолчанию

Цитата:
Сообщение от akokin Посмотреть сообщение
...
Для меня это слишком сложной кажется задача...
Да для меня создать шаблон с повторяющимя текстом оказалось сложно!
Какое там сравнение документов!..
mykky_ вне форума Ответить с цитированием
Старый 02.10.2009, 03:15   #12
Sasha_Smirnov
Особый статус
Участник клуба
 
Аватар для Sasha_Smirnov
 
Регистрация: 24.11.2008
Сообщений: 1,535
По умолчанию

Шутка удалась. Сравнение текста файлов делает функция
Код:
Sub Comparison()
Result = StrComp(string1, string2, vbTextCompare)
End Sub
Result = 0, когда строки 1 и 2 (куда можно запихать тексты файлов) равны.

Функцией
Код:
position = InStr(startpos, string1, string2, vbTextCompare)
можно (в цикле) находить позиции несовпадений, затем возобновлять цикл поиска.

Словом, техника и теперь на высоте. Но, мне кажется, это «поверка гармонии» алгеброй. Из того, что машинный перевод даст, скажем (при каком-то алгоритме) 18 тыс. отличий от эталона, нельзя заключить, что он (перевод) плох. Скорее другое — живой переводчик где-то предпочёл другой порядок слов, и всё. Так что прогноз неутешителен.

Последний раз редактировалось Sasha_Smirnov; 02.10.2009 в 15:25. Причина: текста.
Sasha_Smirnov вне форума Ответить с цитированием
Старый 02.10.2009, 04:48   #13
mykky_
 
Регистрация: 29.09.2009
Сообщений: 7
По умолчанию

Цитата:
Сообщение от Sasha_Smirnov Посмотреть сообщение
Шутка удалась. Сравнение файлов делает функция
Код:
Sub Comparison()
Result = StrComp(string1, string2, vbTextCompare)
End Sub
Result = 0, когда строки 1 и 2 (куда можно запихать тексты файлов) равны.

Функцией
Код:
position = InStr(startpos, string1, string2, vbTextCompare)
можно (в цикле) находить позиции несовпадений, затем возобновлять цикл поиска.

Словом, техника и теперь на высоте. Но, мне кажется, это «поверка гармонии» алгеброй. Из того, что машинный перевод даст, скажем (при каком-то алгоритме) 18 тыс. отличий от эталона, нельзя заключить, что он (перевод) плох. Скорее другое — живой переводчик где-то предпочёл другой порядок слов, и всё. Так что прогноз неутешителен.
---------------

Yes! Вы вернули мне самое дорогое – веру в IT!

А теперь серьезно.

Тупым я уже показаться не боюсь. Боюсь показаться наглым.
Если не затруднит и будет время, чиркните текст этой программы. Конечно, если она не сложная.

Дело в том, что опыта программирования на VBA для Word-а у меня "0". Если я "запихну текст файлов в строку", то, боюсь, у меня парализует все мои инструменты... Word имею в виду прежде всего.

Относительно прогноза. Возможно, вы правы. Но здесь нужно только пробовать. Дело в том, что оценку качества перевода "английский-русский" делать большого смысла нет. Тем более, "русский-китайский". Речь идет о близких языковых группах. Например, "русский-украинский" или наоборот. И статьи для оценки будут 1000-2000 знаков. Поэтому надежда есть. Если получится – отпишусь.

А за совет еще раз спасибо. И это – не шутка!

Николай

Последний раз редактировалось mykky_; 02.10.2009 в 04:50.
mykky_ вне форума Ответить с цитированием
Старый 02.10.2009, 05:18   #14
Sasha_Smirnov
Особый статус
Участник клуба
 
Аватар для Sasha_Smirnov
 
Регистрация: 24.11.2008
Сообщений: 1,535
По умолчанию

Вот если бы переводчик сохранял (со 100-% гарантией) разбивку на абзацы. А лучше бы и предложения переводил один в один.

Сканировать же тупо от слова к слову однозначно бессмысленно.

Может, так, по количеству значимых слов?

Код:
Ключевые слова      Сырой перевод    Эталон
мелиорация            2                 1
мелиорации            3                 3
мох                   3                 3
мха...
Ничего не «парализует»: в строке допустимо около 2³¹ символов.

В качестве примера ознакомьтесь с моим приложением DateShift и прочими. Там подходы объяснены. Я тоже учился на БЭСМ!

Последний раз редактировалось Sasha_Smirnov; 02.10.2009 в 05:30.
Sasha_Smirnov вне форума Ответить с цитированием
Старый 02.10.2009, 06:27   #15
mykky_
 
Регистрация: 29.09.2009
Сообщений: 7
По умолчанию

Цитата:
Сообщение от Sasha_Smirnov Посмотреть сообщение
Вот если бы переводчик сохранял (со 100-% гарантией) разбивку на абзацы. А лучше бы и предложения переводил один в один.

Сканировать же тупо от слова к слову однозначно бессмысленно.

Может, так, по количеству значимых слов?

Код:
Ключевые слова      Сырой перевод    Эталон
мелиорация            2                 1
мелиорации            3                 3
мох                   3                 3
мха...
Ничего не «парализует»: в строке допустимо около 2³¹ символов.

В качестве примера ознакомьтесь с моим приложением DateShift и прочими. Там подходы объяснены. Я тоже учился на БЭСМ!
Добрый!

Я все-таки ошибся. Изначальная посылка была правильной. Речь не только о посимвольном сравнении...

Пример.
Исходная фраза (на пунктуация не смотреть):
"Спасение утопающих-дело рук самих утопающих"

Эталон
"Порятунок тих, хто тоне справа їхніх власних рук"

Перевод "Прагмой"
"Порятунок потопаючих - справа рук самих потопаючих"

Word-ом сравниваю документы.

Результат (скриншот) в аттаче. Это и есть документ для анализа. В нем группа комментариев и второй слой исправлений.
Что такое качество перевода (на мой взгляд)?
Это сумма символов из комментариев и плюс тех, что находятся во втором слое текста. То есть то, что придется перепечатать.
Форматирование игнорируем.
Похоже, все таки так.

А вот такого я точно не напишу. До самой пенсии в следующей жизни.

А пример с календарем отличный! По-белому завидую!

Николай
Изображения
Тип файла: jpg P1.jpg (183.2 Кб, 136 просмотров)

Последний раз редактировалось mykky_; 02.10.2009 в 06:37.
mykky_ вне форума Ответить с цитированием
Старый 02.10.2009, 06:50   #16
Sasha_Smirnov
Особый статус
Участник клуба
 
Аватар для Sasha_Smirnov
 
Регистрация: 24.11.2008
Сообщений: 1,535
По умолчанию

Цитата:
Сообщение от mykky_ Посмотреть сообщение
...такого я точно не напишу.
Ну алгоритм-то можете написать. Перевод с русского на бэйсик не сложен.

Лично я не практиковал эти самые слои (редакторские выноски) в качестве объектов программирования. Посему и не кричу «эврика!». Эвристика какая-то нужна, алгоритм формирования нужного вам показателя.
Sasha_Smirnov вне форума Ответить с цитированием
Старый 02.10.2009, 16:16   #17
Sasha_Smirnov
Особый статус
Участник клуба
 
Аватар для Sasha_Smirnov
 
Регистрация: 24.11.2008
Сообщений: 1,535
По умолчанию Эврика?

Попробуйте сравнивать статистику удобочитаемости, это где-то в недрах самого Word.
Sasha_Smirnov вне форума Ответить с цитированием
Ответ


Купить рекламу на форуме - 42 тыс руб за месяц



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Не открываются документы Евген Microsoft Office Excel 3 17.11.2015 21:41
Помогите пожалуйста сравнить два столбца ddimma Microsoft Office Excel 4 16.01.2009 09:01
Ув.Специалисты помогите сравнить списки lelik759 Microsoft Office Excel 2 25.09.2008 00:34
помогите! как сравнить BMP файлы? lenivec Мультимедиа в Delphi 20 14.11.2007 21:47