摘要
Web2.0已成为因特网发展的新趋势,网站由原来的静态的图片文字显示逐渐演变成动态的、有高交互性的文字图片及媒体的融合。导致Web流量的特性发生极大的改变。研究Web2.0下HTTP流量的新特征,探究引起不同类型网络流量差异性的原因,有助于流量分类或用户行为重构。本文用一种有效的方法识别提取大量HTTP流中的"点击页面"和"内嵌页面",并比较不同类型排名前100名的网站主页的流量特性,如新闻类、B2C商业网站、搜索引擎类、社交网站类。实验数据显示流量差异化原因主要在于广告的作用、不同类型网站结构不同,及用户行为的影响。