(11) | 033096 (13) B1 |
Разделы: A B C E F G H |
(21) | 201600675 |
(22) | 2015.05.22 |
(51) | G06F 17/27 (2006.01) |
(31) | 2014111223 |
(32) | 2014.03.25 |
(33) | RU |
(43) | 2017.01.30 |
(86) | PCT/RU2015/000322 |
(87) | WO 2015/147706 2015.10.01 |
(71) | (72)(73) РОГАЧЕВ ИГОРЬ ПЕТРОВИЧ (RU) |
(74) | Кравченко А.А. (RU) |
(54) | СПОСОБ ПРЕОБРАЗОВАНИЯ СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ |
(57) 1. Выполняемый процессором или процессорами компьютерного устройства способ преобразования структурированного массива данных, содержащего, по меньшей мере, текст на естественном языке, для получения логически, грамматически и орфографически верной преобразованной структуры данных, содержащей логические конструкции элементов массива данных, причем упомянутый способ содержит, по меньшей мере, этапы, на которых:
А) формируют первую структуру данных структурированного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы, причем упомянутое формирование упомянутой первой структуры данных осуществляют следующим образом:
идентифицируют исходную структуру данных структурированного массива данных;
идентифицируют элементы исходной структуры данных;
идентифицируют первые логические разделы упомянутых элементов исходной структуры данных и вторые логические разделы упомянутых элементов исходной структуры данных; и
формируют первую структуру данных структурированного массива данных, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных содержат первые логические разделы и вторые логические разделы; причем
первые логические разделы представляют собой суждения, являющиеся основаниями, вторые логические разделы представляют собой суждения, являющиеся следствиями;
Б) формируют базу данных логических связей логических разделов упомянутых элементов первой структуры данных, причем упомянутое формирование упомянутой базы данных осуществляют следующим образом:
идентифицируют элементы первой структуры данных, содержащие один упомянутый первый логический раздел, и элементы первой структуры данных, содержащие один упомянутый второй логический раздел;
идентифицируют элементы первой структуры данных, содержащие более одного упомянутого первого логического раздела, и элементы первой структуры данных, содержащие более одного упомянутого второго логического раздела;
среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют логические связи между упомянутыми первыми логическими разделами или между упомянутыми вторыми логическими разделами;
среди элементов первой структуры данных, содержащих более одного упомянутого первого логического раздела, и в элементах первой структуры данных, содержащих более одного упомянутого второго логического раздела, идентифицируют элементы первой структуры данных, не имеющие логической связи между логическими разделами; и
формируют базу данных логических связей логических разделов элементов первой структуры данных, причем
упомянутые логические связи логических разделов представляют собой соединительные связи, разделительные связи, эквивалентные связи между соответствующими суждениями;
В) формируют вторую структуру данных структурированного массива данных, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных содержат логические конструкции логических разделов упомянутых элементов первой структуры данных, сформированные с использованием информации из упомянутой базы данных логических связей логических разделов, причем упомянутые логические разделы содержат первые семантические части и вторые семантические части; причем упомянутое формирование упомянутой второй структуры данных осуществляют следующим образом:
формируют логические конструкции логических разделов элементов первой структуры данных, используя информацию из базы данных логических связей логических разделов элементов первой структуры данных и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый первый логический раздел, и логические разделы упомянутых элементов первой структуры данных, содержащих один упомянутый второй логический раздел; и
формируют вторую структуру данных, содержащую элементы второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой сформированные логические конструкции логических разделов первой структуры данных, причем
упомянутые первые семантические части представляют собой смысловые ядра суждений, являющиеся субъектами суждений, предикатами суждений и связками;
упомянутые вторые семантические части представляют собой понятия суждений, являющиеся признаками субъектов и предикатов суждений, а также термины суждений, являющиеся связкой, не раскрывающей включение или исключение подкласса в класс объектов или не раскрывающей принадлежность или непринадлежность элемента к классу, и/или являющиеся кванторным словом, и/или являющиеся любыми иными частями логического раздела, за исключением упомянутых первых семантических частей;
Г) формируют базу данных семантических частей логических разделов из упомянутых вторых семантических частей, причем упомянутые вторые семантические части исключаются из соответствующих упомянутых логических разделов;
Д) формируют грамматически и орфографически верные семантические части упомянутых логических разделов путем лингвистических преобразований над упомянутыми семантическими частями, причем упомянутое формирование упомянутых грамматически и орфографически верных семантических частей осуществляют следующим образом:
в упомянутых вторых семантических частях упомянутых вторых логических разделов элементов второй структуры данных идентифицируют, по меньшей мере, уточняющие структуры вторых семантических частей вторых логических разделов и
осуществляют лингвистические преобразования над всеми семантическими частями, за исключением упомянутых особых семантических частей упомянутых первых и вторых логических разделов, для формирования грамматически и орфографически верных семантических частей логических разделов элементов второй структуры данных, причем
упомянутые лингвистические преобразования осуществляют таким образом, чтобы в результате были восстановлены правильная грамматика и орфография отдельных упомянутых семантических частей, причем такие преобразования включают, не ограничиваясь, согласование родов, чисел, падежей, замену и/или удаление несоответствующих знаков препинания;
Е) формируют итоговую структуру данных структурированного массива данных, содержащую элементы упомянутой итоговой структуры данных, причем упомянутые элементы итоговой структуры данных содержат логические конструкции, содержащие, по меньшей мере, упомянутые грамматически и орфографически верные семантические части логических разделов;
причем упомянутое формирование упомянутой итоговой структуры данных осуществляют следующим образом:
формируют из первых грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и упомянутых грамматически и орфографически верных уточняющих структур вторых семантических частей вторых логических разделов элементов второй структуры данных смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных и
формируют итоговую структуру данных, содержащую элементы итоговой структуры данных, причем упомянутые элементы итоговой структуры данных представляют собой логические конструкции, содержащие упомянутые грамматически и орфографически верные семантические части логических разделов элементов второй структуры данных.
2. Способ по п.1, отличающийся тем, что этап Г) характеризуется, по меньшей мере, этапами, на которых
идентифицируют первые логические разделы элементов второй структуры данных и вторые логические разделы элементов второй структуры данных;
в упомянутых первых логических разделах и вторых логических разделах элементов второй структуры данных идентифицируют первые семантические части и вторые семантические части; и
в упомянутых первых и вторых логических разделах элементов второй структуры данных идентифицируют, по меньшей мере, особые семантические части первых логических разделов элементов второй структуры данных и особые семантические части вторых логических разделов элементов второй структуры данных и формируют базу данных особых семантических частей логических разделов элементов второй структуры данных путем перемещения упомянутых особых семантических частей в упомянутую формируемую базу данных особых семантических частей логических разделов элементов второй структуры данных.
3. Способ по п.1, отличающийся тем, что упомянутые логические конструкции из упомянутой итоговой структуры данных дополнительно могут содержать упомянутые сформированные смысловые сочетания грамматически и орфографически верных семантических частей вторых логических разделов элементов второй структуры данных.
4. Устройство преобразования структурированного массива данных, содержащего, по меньшей мере, текст на естественном языке, для получения логически, грамматически и орфографически верной преобразованной структуры данных, содержащей логические конструкции элементов массива данных, содержащее по меньшей мере
один или более процессоров;
один или более модулей ввода/вывода (I/O) и
память, содержащую код программы, который при выполнении побуждает упомянутые один или более процессоров упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из пп.1-3 формулы, и содержащую подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, текст на естественном языке.
5. Устройство по п.4, отличающееся тем, что упомянутые подлежащие преобразованию один или несколько структурированных массивов данных являются загружаемыми, а упомянутое устройство выполнено с возможностью соединения с базой данных, в которой хранятся упомянутые загружаемые, подлежащие преобразованию один или несколько структурированных массивов данных, для осуществления загрузки в упомянутую память устройства по меньшей мере одного загружаемого, подлежащего преобразованию структурированного массива данных.
6. Система преобразования структурированного массива данных, содержащего, по меньшей мере, текст на естественном языке, для получения логически, грамматически и орфографически верной преобразованной структуры данных, содержащей логические конструкции элементов массива данных, содержащая по меньшей мере
одно или более устройств, выполненных в виде устройств по любому из пп.4 или 5 формулы;
один или несколько серверов, обеспечивающих регулирование обменом данных в системе;
одну или несколько баз данных, предназначенных для хранения данных, выполненных с возможностью взаимодействия с упомянутыми одним или более устройствами;
одну или более сетей передачи данных, через которые осуществляется взаимодействие упомянутых устройств, серверов и баз данных.
7. Система по п.6, отличающаяся тем, что способ по любому из пп.1-3 формулы осуществляется одним или более упомянутыми серверами, а упомянутые устройства представляют собой тонкий клиент.
8. Система по п.7, отличающаяся тем, что упомянутая база данных служит для хранения данных, представляющих собой, по меньшей мере, код программы, который при выполнении побуждает упомянутые один или более процессоры упомянутого устройства и/или устройства, связанного с упомянутым устройством, выполнять действия способа по любому из пп.1-3 формулы, подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, текст на естественном языке.
9. Система по любому из пп.6-8, отличающаяся тем, что упомянутая сеть передачи данных представляет собой одно из: локальная сеть (LAN), глобальная сеть (WAN), информационно-телекоммуникационная сеть Интернет, виртуальная частная сеть (VPN).
10. Машиночитаемый носитель данных, содержащий код программы, который при выполнении побуждает процессор или процессоры устройства, с которым взаимодействует машиночитаемый носитель данных, выполнять действия способа по любому из пп.1-3 формулы.
|