Page 1 of 1

我不知道你们中有多少人至

Posted: Tue Dec 24, 2024 6:33 am
by zihadhasan011
Cygwin 和 GREP 您可能想知道第 4 个和第 7 个值是什么。在标准 Linux 服务器日志的一行中,第 4 个值是访问日期,第 7 个值是访问的 URL。我们想知道每天抓取了多少页面,因此只有日期和 URL 对我们来说很重要。 Linux 服务器日志中的原始行如下所示:" 经过上面的grep命令行处理后,我们得到: [01/四月/2011:01:32:59 /站点地图 因此,执行此命令后,我们将得到一个干净的文本文件,其中仅包含日期和 URL,我们可以稍后在 Excel 中使用它们来创建所需的图表。


今已经被 Linux 命令行害死了。(当我向我的一个客 律师数据 户解释这个问题时,他的表情告诉我他后悔问了这个问题……) 对于不熟悉 Linux 的人来说,这可能有点困难,但相信我,这并不像你想象的那么困难,好消息是,从现在开始我们不必做任何与 Linux 相关的事情。 2. 将文件 googlebot.txt 导入 Excel 并创建图表: 首先我们需要将新建的文件googlebot.txt导入到Excel中,导入的时候需要注意两点: 对于“选择最能描述您的数据的文件类型”,我们选择“分隔”; 对于“分隔符”,我们在这里选择“Tab”。


因此在 Excel 中,我们得到一个两列的数据表。第一列是时间,第二列是 URL。 时间和网址 第一列包含我们不需要的详细时间,因此这里我们使用Excel 中的 MID 函数来消除它们: 1. 插入新列并将其命名为“日期” 2、选中A3,然后插入MID函数,在MID函数窗口中选择“B3”,起始数字为“2”,字符数为“6”; Excel MID 函数 3、现在A3是纯日期数据,现在我们将其向下拖动以填充A列的其他单元格并隐藏B列; 日期和网址 4、使用“subtotal”功能统计每天抓取的URL数量:在“每次更改”处选择“日期”行,“使用功能”处选择“计数”,在“将小计添加到”处选择“URL”; 小计 然后我们得到这个: 小计电子表格 5. 定位可见单元格并将其复制并粘贴到新的电子表格中; 新工作表 6. 创建图表。