日志文件 我们将在这个项目中使用原始 Apache 文件。为什么仅 Pandas 不足以进行日志分析 Pandas使用 构建的开源数据操作工具)在数据科学中非常普 哥伦比亚电话号码列表遍。切片和切片表格数据结构是必须的,当数据适合内存时,哺乳动物就像一个魅 哥伦比亚电话号码列表力!换句话说,几千兆字节。但不是太字节。除了并行计算,数据库通常是不适合内存的大数据任务的更好解决方案。借助数据库,我们可以处理消耗 级磁盘空间的数据集。
切都可以立即查询(通过 SQL)、访问和更新!在本文中,我们将通过 在 中以编程方式查询我们的原始日志数据。它易于使用、经济实惠且速度极快 - 即使是 TB 级数据! 还允许您查询存储在 上的文件。甜的!如果 不适合您并且您想尝试替代方案那么 哥伦比亚电话号码列表 和 也提供云数据仓库。它们还与 很好地集成: 亚马逊:微软:Azure 存储 Azure 数据仓库 创建一个 帐户并 哥伦比亚电话号码列表配置云存储 谷歌云存储和谷歌云平台 的一部分,谷歌的云计算服务套件。 不是免费的,但您可以使用 300 美元的积分试用一年,并可以访问所有产品。很酷
请注意,试用期结束后,免费套餐仍可让您免费访问大部分 资源。每月有 的存储空间,如果您想试验小型数据集、进行概念证明等工作,这通常就足够了。相信我,有很多。惊人的。事物。到。尝试!您可以在此处注册免费试用。完成注册后,将自动 哥伦比亚电话号码列表创建一个新项目,并使用一个随机且相当奇特的名称 - 例如,我的项目是!创建我们的第一个存储桶来存储我 哥伦比亚电话号码列表们的日志文件 在 中,文件存储在“存储桶”中。它们将包含我们的日志文件。要创建您的第一个存储桶,请至存储 > 浏览器 > 创建存储