Несмотря на то, что развитие сети интернет и электронной коммерции в частности, достигло широкого распространения, далеко не все операции перешли в сферу онлайн обслуживания. В связи с чем возникают проблемы с идентификацией пользователей, которые обращаются в компанию по телефону или отправляют письма на электронную почту. Вследствие чего возникают проблемы с расчётом эффективности инвестиций в тот или иной вид маркетинговых инициатив.
На рынке представлен ряд инструментов для отслеживания телефонных звонков, существуют разные подходы к реализации, но суть этих методов заключается в отображении разных телефонных номеров разным группам пользователей или каждому пользователю в отдельности. Данный метод работает довольно эффективно, но требует дополнительных финансовых затрат, кроме того, набор телефонных номеров естественным образом ограничивает количество пользователей.
В качестве альтернативы предложен метод идентификации пользователей по косвенным признакам, а именно, зная время обращения и телефонный номер, а, следовательно, и географическую локацию, а также потребности обратившегося клиента, есть возможность сопоставить эти данные с визитами на сайт. Получив перечень параметров достаточный для идентификации пользователей, можно методом экспертной оценки из множества визитов на сайт выбрать подходящий, либо констатировать его отсутствие.
Таким образом, объект можно описать набором критериев (параметров) А(1), А(2) … А(n), принадлежащих соответствующим базовым множествам U(1), U(2) … U(n). Совокупность критериев с соответствующими значениями характеризует приемлемость P данного объекта относительно поставленной задачи [1].
Задача осложнена отсутствием возможности установить точное соответствие параметров, т.к. между визитом и обращением проходит определенное время, кроме того, данные могут быть неполными, как в описании параметров клиента, так и в описании параметров пользователя. Таким образом, эксперт может только предполагать соответствие с определенной вероятностью.
Для формализации данного процесса потребуется использование правил нечеткого вывода. В нечеткой логике, в отличие от классической, вместо величин истина и ложь используется величина степень истинности.
Переходя к логике предикатов, нам необходимо сформулировать предикат соответствия:
Соответствует (X,Y,Р) :-
Соответствие атрибута А1 (XA1,YA1,PA1),
…
Соответствие атрибута Аn (XAn,YAn,PAn).
где
X — клиент, обратившийся в компанию,
Y – пользователь, с которым мы его идентифицируем,
Р — степень истинности гипотезы.
Данный предикат будет определяться через соответствие атрибутов экземпляров классов Клиент и Пользователь. Поскольку соответствие каждого из атрибутов является неточным, то для каждого из них будет своя степень истинности, которая будет иметь определенное влияние на конечную величину. Предикаты соответствия атрибутов будут формироваться на этапе извлечения знаний.
При реализации системы поддержки принятия решений выделяют четыре основных задачи [2]:
- извлечение знаний;
- верификация знаний;
- вывод рекомендаций;
- объяснение рекомендаций.
Извлечение знаний можно реализовать путем описания знаний эксперта в данной области, задав допустимые значения атрибутов и правила их соответствия. Но при экспертной оценке есть риск получить неточные знания, а также возникает потребность поддерживать их актуальность, т.к. условия соответствия могут со временем меняться.
В качестве решения данных проблем выступают индуктивные методы машинного обучения. Индуктивное логическое программирование — это один из подходов к машинному обучению. Оно представляет собой метод изучения отношений на примерах. В методе ILP в качестве языка определения гипотез используется логика предикатов [3].
В рассматриваемой задаче имеется множество объектов класса Клиент и множество объектов класса Пользователь. Существует некоторая зависимость между экземплярами данных классов, но она неизвестна. Известна только конечная совокупность прецедентов — пар «Клиент, Пользователь», называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом вводится степень истинности. Данный подход также снимает задачу верификации знаний.
В качестве обучающей выборки можно взять множество пар, соответствие между которыми определено экспертом, а в дальнейшем расширять её новыми поступающими данными.
При выводе рекомендаций, помимо соответствий, степень истинности которых высока, система также предоставляет эксперту соответствия со средней и низкой степенью истинности, которые в зависимости от решения эксперта будут пополнять множества положительных или отрицательных решений для обучающей выборки, тем самым уточняя алгоритм. Положительные примеры будут расширять множество решений, отрицательные, напротив, будут сужать его.
Задача объяснения рекомендации в данном случае сводится к выводу определяющих атрибутов и их значений.
Список литературы:
- Борисов, Крумберг, Федоров Принятие решений на основе нечетких моделей. Примеры использования, 1990. Стр. 94.
- Системы поддержки принятия решений: Учебно-метод. пособие / Попов А.Л. – Екатеринбург: Урал. гос. ун-т, 2008. – 26с.
- Братко И. Алгоритмы искусственного интеллекта на языке PROLOG, 3-е издание. : Издательский дом «Вильяме», 2001. — 446с. :[schema type=»book» name=»ИСПОЛЬЗОВАНИЕ ИНДУКТИВНЫХ МЕТОДОВ И ПРАВИЛ НЕЧЕТКОГО ВЫВОДА ДЛЯ РЕШЕНИЯ ЗАДАЧ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ ВЕБ-РЕСУРСА В РАМКАХ РЕАЛИЗАЦИИ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ» description=»В статье рассмотрен алгоритм идентификации пользователей веб-ресурса для расчёта эффективности инвестиций в интернет маркетинг. Алгоритм реализован на базе индуктивных методов и правил нечеткого вывода. Обоснованы преимущества данного подхода в сравнении с инструментами отслеживания звонков. » author=»Степанов Илья Сергеевич» publisher=»БАСАРАНОВИЧ ЕКАТЕРИНА» pubdate=»2017-01-25″ edition=»ЕВРАЗИЙСКИЙ СОЮЗ УЧЕНЫХ_31.10.15_10(19)» ebook=»yes» ]