В современный век научно-информационных технологий специалистам приходится работать с большим количеством сведений, данных, получаемых из окружающего мира. Большие потоки информации требуют глубокого понимания наряду с минимальными затратами времени.
Ученым представляется достаточно сложным установить значение категории понимание, так это явление относится скорее к неосознаваемым или частично осознаваемым процессам деятельности человека, чем к формально-логическим [1].
Понимание представляет собой креативную, целенаправленную деятельность, серию взаимозависимых творческих актов, осуществляющихся на протяжении всей “встречи” читателя с художественным или научным произведением. При этом успешность построения некоторого мыслительного образа безусловно зависит от уровня социального развития личности, от степени полноты картины мира, которая присутствует в сознании индивида, а также от степени развитости коммуникативной и языковой компетенций читающего, от уровня сформированности его чувства языка или языковой догадки [2].
В результате понимания происходит последовательное изменение структуры текста в сознании читателя и процесс мысленного перемещения от одного элемента текста к другому, то есть происходит логическое перестроение и переработки структуры текста.
Одним из основных видов переработки текста является компрессия – сжатое изложение его корпусного строения. Работа над компрессией текста в свою очередь способствует его более глубокому пониманию: текст можно считать по настоящему осмысленным, если читатель способен представить основное содержание прочитанного в сколь угодно сжатой форме.
Компрессия позволяет совершенствовать навыки и умения чтения, понимания, анализа научного текста и написания аннотации, реферата, рецензии, реферативного обзора, курсовой работы и основывается на раскрытии смысловой структуры первоисточника.
Информационная компрессия – это сжатие плана означающего при сохранении плана означаемого. Для определения предела сжатия существует понятие текстовой нормы: в разных текстах она будет разной, однако у этой нормы есть и общий показатель: речевая единица не должна утрачивать своей сообщающей функции.
В «Словаре лингвистических терминов» дается следующее определение текстовой нормы – «гармоничное соответствие элементов текста, его формы и содержания авторской интенции и ориентации на адресата. Форма взаимодействия между компонентами, которая является наиболее благоприятной для получения запрограммированного результата» [3].
Вопрос о текстовой норме особенно жестко стоит в деловой и справочной литературе, а также во вторичной научной литературе (реферат, аннотация, тезисы).
Среди мотивов, обусловливающих компрессию информации, называют следующие [4]:
• требования языковой прагматики;
• эстетические требования и требования жанра;
• стилистические требования.
Языковая прагматика подразумевает использование терминов, дающих максимальное свертывание информации; жанровые установки текста также диктуют особые условия применительно к сжатию оригинального текста; стилистические требования подразумевают употребление определенных стилистических приемов, таких как, умышленное умолчание, недоговоренность и т. д.
Существуют семиотические и коммуникативные способы информационной компрессии.
К семиотическим (знаковым, языковым) относятся: лексическая компрессия, синтаксическая компрессия и формирование речевых стереотипов.
К коммуникативным (собственно текстовым) относятся: свертывание информации и применение повторной номинации.
Идеальным примером лексической компрессии считается употребление термина без его определения, так как термин номинирует понятие в предельно свернутом виде.
Синтаксическая компрессия предусматривает сжатие знаковой структуры путем эллиптирования, грамматической неполноты, бессоюзия, синтаксической асимметрии (пропуска логических звеньев высказывания).
Речевой стереотип, как правило, рождается в связи с его частым употреблением в определенной ситуации [4].
Необходимо выделить три основные правила компрессии текста, которые состоят в следующем:
1. Внимательное чтение текста и выделение ключевых слов и предложений, т.е. слов и предложений, содержащих основной смысл высказывания. При этом для нахождения ключевого элемента текста необходимо знать строение абзаца, так как любой абзац содержит зачин и комментирующую часть, в которой раскрывается утверждение главной абзацной фразы, и где находятся ключевые слова. Как правило, абзац завершается выводом.
2. Написание вторичного текста. Для выявления своих позиций, автор вторичного текста по отношению к первоисточнику, использует специальные стандартные клише, называемые transitional expressions в западной практике, выбор которых раскрывает и отражает структуру текста-первоисточника. Например: В статье обосновывается принцип…, статья представляет собой обзор…, в работе анализируются различные подходы …, в статье обобщается опыт…, в диссертации использованы следующие методы исследования.
3. В планах, тезисах, аннотации и при реферировании для называния основных положений текста используются ключевые слова и словосочетания, или слова с обобщенно-конкретным значением для краткой передачи основного содержания абзацев или частей текста, которые необходимо определять самостоятельно.
В настоящее время существуют достаточно простые программы, опирающиеся на статистический анализ отдельных терминов в текстах, такие как WordStat, а также сложнейшие приложения Aerotext и Businessobjects Text Analysis.
С развитием Интернета становится достаточно популярным анализ, базирующийся на технологиях текстомайнинга, т.е. способности специальных компьютерных программ находить слова с заданными значениями в неструктурированных текстовых массивах. Процесс может реализовываться не только посредством внедряемых в организации приложений, но и в виде онлайнового сервиса. В последнее время текстомайнинговый анализ множественных открытых источников информации становится доступным для коммерческих, политических и других организаций за счет появления именно таких онлайновых служб. Одна из подобных простых программ – Galaktika-ZOOM («Галактика») [5].
«Галактика ZOOM» – это технология динамического контент-анализа, позволяющая строить информационные портреты объектов по любой текстовой информации, в частности по сообщениям СМИ. Такой портрет состоит из статистически значимых слов и выражений, сопровождающих упоминание объекта.
«Галактика ZOOM» обеспечивает поиск в информационных массивах с применением языка запросов, а также контекстный или тематический поиск информации с учетом морфологии.
Уникальной особенностью системы «Галактика ZOOM» является умение выявлять значимые слова и словосочетания документа, отражающие его смысл. Программа позволяет уточнить запрос, выбрав слово/словосочетание для включения (колонка «И») или исключения (колонка «И НЕ») [5].
Таким образом, практика подтверждает необходимость компрессии при реферативном переводе и выявляет три её вида. Первый: сокращение только языкового кода, не влекущее ни уменьшения информации, ни её потерь. Среди основных методов здесь можно назвать: устранение повторов, вставных конструкций, более короткий перифраз, использование аббревиатур и композитов, синтаксический эллипсис. Ко второму виду компрессии относится одновременное сокращение языкового кода и объёма семантической информации с возможностью полного восстановления семантического наполнения текста. Третий вид компрессии – это одновременное сокращение языкового кода и объёма семантической информации (компрессия информации) без возможности восстановления информации полностью без обращения к первичному тексту.
Библиографическая ссылка
Буравцова А.Н., Чопорова Е.И. КОМПРЕССИЯ ТЕКСТА КАК ВСПОМОГАТЕЛЬНОЕ СРЕДСТВО В ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА // Международный студенческий научный вестник. – 2015. – № 5-1. ;URL: https://eduherald.ru/ru/article/view?id=12797 (дата обращения: 21.11.2024).