电子商务中Web数据挖掘技术应用的分析|电子商务 数据挖掘

电子商务中Web数据挖掘技术应用的分析

电子商务中Web数据挖掘技术应用的分析 1 概述 电子商务是指企业或个人以网络为载体,应用电子手段,利用现代信 息技术进行商务数据交换和开展商务业务的活动。随着互联网的迅速发展,电子 商务比传统商务具有更明显的优势,由于电子商务具有方便、灵活、快捷的特点, 使它已逐渐成为人们生活中不可缺少的活动。目前电子商务平台网站多,行业竞 争强,为了获得更多的客户资源,电子商务网站必须加强客户关系管理、改善经 营理念、提升售后服务。数据挖掘是从数据集中识别出隐含的、潜在有用的、有 效的,新颖的、能够被理解的信息和知识的过程。由数据集合做出归纳推理,从 中挖掘并进行商业预判,能够帮助电子商务企业决策层依据预判,对市场策略调 整,将企业风险降低,从而做出正确的决策,企业利润将最大化。随着电子商务 的应用日益广泛,电子商务活动中会产生大量有用的数据,如何能够数据挖掘出 数据的参考价值?研究客户的兴趣和爱好,对客户分门别类,将客户心仪的商品 分别推荐给相关客户。因此,如何在电子商务平台上进行数据挖掘成为研究的热 点问题。

2 数据挖掘技术概述 数据挖掘(Data Mining),也称数据库中的知识发现(Knowledge Discovery in Database,KDD)。数据挖掘一般是指从海量数据中应用算法查找 出隐藏的、未知的信息的过程。数据挖掘是一个在大数据资源中利用分析工具发 现模型与数据之间关系的一个过程,数据挖掘对决策者寻找数据间潜在的某种关 联,发现隐藏的因素起着关键作用。这些模式是有潜在价值的、并能够被理解的。

数据挖掘将人工智能、机器学习、数据库、统计、可视化、信息检索、并行计算 等多个领域的理论与技术融合在一起的一门多学科交叉学问,这些学科也对数据 挖掘提供了很大的技术支撑。

3 Web 数据挖掘特点 Web 数据挖掘就是数据挖掘在Web中的应用。Web数据挖掘的目的 是从万维网的网页的内容、超链接的结构及使用日志记录中找到有价值的数据或 信息。依据挖掘过程中使用的数据类别,Web数据挖掘任务可分为:Web内容挖 掘、Web结构挖掘、Web使用记录挖掘。1)Web内容挖掘指从网页中提取文字、图片或其他组成网页内容的 信息,挖掘对象通常包含文本、图形、音视频、多媒体以及其他各种类型数据。

2)Web结构挖掘是对Web页面之间的结构进行挖掘,挖掘描述内容 是如何组织的,从Web的超链接结构中寻找Web结构和页面结构中的有价值模式。

例如从这些链接中,我们可以找出哪些是重要的网页,依据网页的主题,进行自 动的聚类和分类,为了不同的目的从网页中根据模式获取有用的信息,从而提高 检索的质量及效率。

4电子商务中Web挖掘中技术的应用分析 1)电子商务中序列模式分析的应用 序列模式数据挖掘就是要挖掘基于时间或其他序列的模式。如在一套 按时间顺序排列的会话或事务中一个项目有存在跟在另一个项目后面。通过这个 方法,WEB销售商可以预测未来的访问模式,以帮助针对特定用户组进行广告 排放设置。发现序列模式容易使客户的行为被电子商务的组织者预测,当用户浏 览站点时,尽可能地迎合每个用户的浏览习惯并根据用户感兴趣的内容不断调整 网页,尽可能地使每个用户满意。使用序列模式分析挖掘日志,可以发现客户的 访问序列模式。在万维网使用记录挖掘应用中,序列模式挖掘可以用于捕捉用户 路径之中常用的导航路径。当用户访问电子商务网站时,网站管理员能够搜索出 这个访问者的对该网站的访问序列模式,将访问者感兴趣但尚未浏览的页面推荐 给他。序列模式分析还能分析出商品购买的前后顺序,从而向客户提出推荐。例 如在搜索引擎是发出查询请求、浏览网页信息等,会弹出与这些信息相关的广告。

例如购买了打印机的用户,一般不久就会购买如打印纸、硒鼓等打印耗材。优秀 的推荐系统将为客户建立一个专属商 2)电子商务中关联规则的应用 关联规则是揭示数据之间隐含的相互关系,关联分析的任务是发现事 物间的关联规则或相关程序。关联规则挖掘的目标是在数据项目中找出每一个数 据信息的内在关系。关联规则挖掘就是要搜索出用户在服务器上访问的内容、页 面、文件之间的联系,从而改进电子商务网站设计。可以更好在组织站点,减少 用户过滤网站信息的负担,哪些商品顾客会可能在一次购物时同时购买?关联规 则技术能够通过购物篮中的不同商品之间的联系,分析顾客的购物习惯。例如购 买牛奶的顾客90%会同时还购买面包,这就是一条关联规则,如果商店或电子商务网站将这两种商品放在一起销售,将会提高它们的销量。关联规则挖掘目标是 利用工具分析出顾客购买商品间的联系,也即典型购物篮数据分析应用。关联规 则是发现同类事件中不同项目的相关性,例如手机加充电宝,鼠标加鼠标垫等购 买习惯就属于关联分析。关联规则挖掘技术可以用相应算法找出关联规则,例如 在上述例子中,商家可以依据商品间的关联改进商品的摆放,如果顾客购买了手 机则将充电宝放入推荐的商品中,如果一些商品被同时购买的概率较大,说明这 些商品存在关联性,商家可以将这些有关联的商品链接放在一起推荐给客户,有 利于商品的销售,商家也根据关联有效搭配进货,提升商品管理水平。如买了灯 具的顾客,多半还会购买开关插座,因此,一般会将灯具与开关插座等物品放在 一个区域供顾客选购。依据分析找出顾客所需要的商品的关联规则,由挖掘分析 结果向顾客推荐所需商品,也即向顾客提出可能会感兴趣的商品推荐,将会大大 提高商品的销售量。

3)电子商务中路径分析技术的应用 路径分析技术通过对Web服务器的日志文件中客户访问站点的访问 次数的分析,用来发现Web站点中最经常访问的路径来调整站点结构,从而帮助 使用用户以最快的速度找到其所需要的产品或是信息。例如在用户访问某网站时, 如果有很多用户不感兴趣的页面存在,就会影响用户的网页浏览速度,从而降低 用户的浏览兴趣,同时也会使整个站点的维护成本提高。而利用路径分析技术能 够全面地掌握网站各个页面之间的关联以及超链接之间的联系,通过分析得出访 问频率最高的页面,从而改进网站结构及页面的设计。

4)电子商务中分类分析的应用 分类技术在根据各种预定义规则进行用户建模的Web分析应用中扮 演着很重要的角色。例如,给出一组用户事务,可以计算每个用户在某个期间内 购买记录总和。基于这些数据,可以建立一个分类模型,将用户分成有购买倾向 和没有购买倾向两类,考虑的特征如用户统计属性以及他们的导航活动。分类技 术既可以用于预测哪些购买客户对于哪类促销手段感兴趣,也可以预测和划分顾 客类别。在电子商务中通过分类分析,可以得知各类客户的兴趣爱好和商品购买 意向,因而发现一些潜在的购买客户,从而为每一类客户提供个性化的网络服务 及开展针对性的商务活动。通过分类定位模型辅助决策人员定位他们的最佳客户 和潜在客户,提高客户满意度及忠诚度,最大化客户收益率,以降低成本,增加 收入。

5)电子商务中聚类分析的应用聚类技术可以将具有相同特征的数据项聚成一类。聚类分析是对数据 库中相关数据进行对比并找出各数据之间的关系,将不同性质特征的数据进行分 类。聚类分析的目标是在相似的基础上收集数据来分类。根据具有相同或相似的 顾客购买行为和顾客特征,利用聚类分析技术将市场有效地细分,细分后应可每 类市场都制定有针对性的市场营销策略。聚类分别有页面聚类和用户聚类两种。

用户聚类是为了建立拥有相同浏览模式的用户分组,可以在电子中商务中进行市 场划分或给具有相似兴趣的用户提供个性化的Web内容,更多在用户分组上基于 用户统计属性(如年龄、性别、收入等)的分析可以发现有价值的商业智能。在 电子商务中将市场进行细化的区分就是运用聚类分析技术。聚类分析可根据顾客 的购买行为来划分不同顾客特征的不同顾客群,通过聚类具有类似浏览行为的客 户,让市场人员对顾客进行类别细分,能够给顾客提供更人性化的贴心服务。比 如通过聚类技术分析,发现一些顾客喜欢访问有关汽车配件网页内容,就可以动 态改变站点内容,让网络自动地给这些顾客聚类发送有关汽车配件的新产品信息 或邮件。

分类和聚类往往是相互作用的。在电子商务中通过聚类行为或习性相 似的顾客,给顾客提供更满意的服务。技术人员在分析中先用聚类分析将要分析 的数据进行聚类细分,然后用分类分析对数据集合进行分类标记,再将该标记重 新进行分类,一直如此循环两种分析方法得到相对满意的结果。

5 结语 随着互联网的飞速发展,大数据分析应