Page 1 of 1

统计显著性- 报告特别强

Posted: Tue Dec 24, 2024 10:07 am
by zihadhasan011
调了与统计显著性相差两个标准误差以上的结果(非零相关性的概率超过 98%)。我们测量的许多因素都属于这一类,这就是我们尽管数据集较小但仍要分享的原因。就相关性数字而言,请记住 0.00 表示无相关性,而 1.0 表示完全相关。我们认为,在像 Google 这样的算法中,数百个因素可能共同发挥作用,0.05-0.1 范围内的数据很有趣,而 0.1-0.3 范围内的数据可能值得更多关注。 排名相关性- 相关性是比较排名较高的页面与排名较低的页面,报告中和下面的数据集报告整个数据集的平均相关性(除非另有说明),以标准误差作为准确性的衡量标准。


常识至关重要- 您将看到一些数据点,就像在我们的网 华侨非洲电话号码资源 页结果集中一样,这些数据点表明,不遵循普遍接受的“最佳实践”(例如在 URL 中使用查询城市的名称)的网站排名会更高。我们强烈建议读者将这些数据作为指导方针,而不是规则(例如,许多在 URL 中使用城市名称的结果可能是具有多个“城市”页面的全国连锁店,因此在 Google 眼中,它们并不像同行那样“本地化”)。 解决了这些问题后,让我们深入研究数据集,您可以在此处下载完整版本: 这20个城市包括: 印第安纳波利斯 奥斯汀 西雅图 波特兰 巴尔的摩 波士顿 孟菲斯 丹佛 纳什维尔 密尔沃基 拉斯维加斯 路易斯维尔 阿尔伯克基 图森 亚特兰大 弗雷斯诺 萨克拉门托 奥马哈 迈阿密 克利夫兰 11 种业务类型/查询包括: 餐厅 洗车 律师 瑜伽馆 书店 公园 冰淇淋 健身房 干洗店 医院 有趣的是,我们收集的结果似乎表明,在多个城市中,Google Places 排名算法并没有太大差异,但是当考虑到业务/查询类型时,有迹象表明 Google 确实可能正在改变排名的计算方式(另一种解释是,不同业务部门根据其类型对因素的权重有很大不同)。


对于这一轮相关性分析,我们聘请了 Matthew Peters 博士 (华盛顿大学应用数学博士),让他根据数据撰写一份研究报告。在讨论城市/查询类型所起的作用时,他指出: 城市不是任何变量的显著变异源,这表明 Google 的算法对所有城市都相同。但是,对于 24 个变量中的 9 个,我们可以拒绝零假设,即业务类型不是相关系数中显著的变异源, a =0.05。这种情况不太可能偶然发生。不幸的是,这个结果有一个警告。方差分析的结果假设残差呈正态分布,但在大多数情况下,残差并不像 Shapiro-Wilk 检验那样呈正态分布。