爬一爬数据采集吧
关注: 19 贴子: 49

  • 目录:
  • 13
    爬一爬网页数据采集器使用简单,完全可视化操作,无需专业知识,会上网就能轻松掌握;功能强大,新闻、论坛、电话邮箱、竞争对手、客户资料、汽车房产、电子商务等任何网站均可采集;数据可导出为多种格式;更有云采集,支持列表采集,分页采集定时采集等。是目前最好用,最简单的免费网页数据采集器!欢迎访问:http://www.pa1pa.com
  • 7
    #本次采用的数据采集器是:爬一爬数据采集器。http://www.pa1pa.com #所采集的网页是:http://beijing.anjuke.com/tycoon/?from=esf_list_navigation #采集的数据为:安居客二手房北京地区优秀经纪人信息(姓名/公司/熟悉区域/联系方式等) 1. 首先在http://www.pa1pa.com下载谷歌浏览器插件,并如下步骤安装。 2. 安装成功后,在浏览器点击插件栏上便会出现””的图标,注册登录即可使用爬一爬数据采集器。 3. 打开想要采集的网站,点击浏览器插件栏的””的图标,启动插
    zl102522 5-23
  • 2
    有这么一个问题,我们日复一日得问着自己,每次回答都带着希望,又怕失望,抓耳挠腮间这个问题几乎要上升到哲学的高度。 “一会儿吃什么?” 《择天记》中鹿晗吃货的本性,分分钟暴露无疑,堪称吃货界的一股清流。 所以,到底啥是好吃的啊? 相信此时很多人会打开大众点评,结合自己的口味,看看别人给的评价、评分,挑一家心仪的饭馆。“吃好吃的去!” 作为数据控,特别是作为手握爬一爬采集神器的数据控,那自然是要把数据抓下来
    z37170 6-30
  • 2
    能用爬一爬爬取贴吧的数据么
  • 0
    爬一爬又"悄悄"发布了新功能啦! 这些功能解决了很多人的痛处,数据采集了一半突然断电,数据太大只能存放到数据库,小伙伴创建的任务简直完美,好想有一模一样的任务..... 不用担心,我们来了~~~ 【1】添加任务导入导出功能 在新创建的任务右上角出现了”导出“功能,可将自己创建好的任务分享给所需要的小伙伴。导出任务时,需要输入需要该任务的小伙伴的用户名(即邮箱)。导出的任务为pt格式,该任务只允许该指定用户导入,否
  • 0
    经过程序员大牛们多日辛苦奋战,爬一爬新版本于上周六上午与大家见面啦,不仅仅增强了功能,连页面都变得好看,再也不是那个内心强大,外表朴实的采集器了,现在的我们内外兼修! 先奉上安装步骤,安装跟之前没有变化。 #插件下载地址:http://www.pa1pa.com #插件安装方式保持不变,30s搞定 简单概括“六部曲”就是:①官网下载插件->②点击浏览器右上角三横图标->③点击更多工具->④点击扩展程序->⑤将插件拖入->⑥添加扩展程序。
  • 0
    1. 确保账号已登录,打开需要采集的网站。 2. 点击插件栏上的 图标,启动爬一爬。 3. 逐一选取需要抓取的列元素。如果色彩框没有包含所有的任务数据,点击列名最右侧的 切换按钮,切换算法,直到选中所有的任务数据。 4. 点击列名右侧的 按钮,采集元素的HTML。 5. 先点击“完成”按钮,再点击“测试”按钮,测试采集的数据是否就是您想要的。如果测试数据为空,点击“返回”,将下载器修改为”js-engine”,然后再测试。本例采用的下载器为”j
  • 1
    1. 确保账号已登录,访问网站 https://www.amazon.cn/gp/book/all_category/ref=sv_b_1/452-789167。 2. 点击插件栏上的 图标,启动爬一爬。 3. 点击页面上需要采集的第一列元素。如果色彩框没有包含所有的任务数据, 点击 切换按钮切换算法,直到选中所有的任务数据。 4. 先点击“完成”按钮,再点击“测试”按钮,测试采集的数据是否就是您想要的。 5. 如果测试数据为空,点击“返回”,将下载器修改为”js-engine”,然后再测试。 6. 确认测试成功后,点击”OK”关
    t1w1 3-21
  • 0
    1. 确保账号已登录,访问需要采集的网站。 2. 点击插件栏上的 图标,启动爬一爬。 3. 点击页面上需要采集的第一列元素。如果色彩框没有包含所有的任务数据, 点击 切换按钮切换算法,直到选中所有的任务数据。本例以日期作为第一列元素。 4. 重复上一步骤,选中Price数据,作为第二列元素;选中Open数据,作为第三列元素…依次类推,直到选完自己所需的全部数据。 5. 确认色彩框选中全部数据后,先点击“完成”按钮,再点击“测试”按钮,测试
  • 0
    有些网页当前页指显示出一部分数据,当向下滚动鼠标的时候,加载产生出更多数据。对于采集这样的网页来说,我们主要采取以下方法:将下载器更改为js-engine,并添加滚动操作。 【具体操作如下】: 1. 确认账号已登录,访问网站http://tennis.lesports.com/。 2. 点击插件栏上的”爬”按钮,启动爬一爬采集器。 3. 依次点击选取所要抓取的元素,如果色彩框没有包含所有的任务数据,点击切换按钮,切换算法,直到选中所有的任务数据。 4. 将下载器更更改
  • 1
    1. 打开网站http://www.57zhe.com/chaoji/,点击浏览器插件栏的“爬”字图标,启动插件。 2. 首先选中全部数据区域,点击数据表column1右侧的“选取子元素”按钮。 3. 在弹出的“请选择子元素”的数据框中,依次双击所需数据,并点击确定。 4. 所需元素选中后,依次点击右侧的“转换”按钮,切换算法,保证色彩框选中了所有的任务数据,并点击“移除”删去column1。 5. 本例采集页面中出现滚动产生新数据的情况,所以将下载器更改为js-engine,添加滚动操
    t1w1 3-16
  • 0
    针对一些图片样式的数据,我们无法直接选中需要具体数据,采用选取子元素的方法,可以帮助大家更好的抓取到数据。 1. 打开网站http://www.57zhe.com/chaoji/,点击浏览器插件栏的“爬”字图标,启动插件。 2. 首先选中全部数据区域,点击数据表column1右侧的“选取子元素”按钮。 3. 在弹出的“请选择子元素”的数据框中,依次双击所需数据,并点击确定。 4. 所需元素选中后,依次点击右侧的“转换”按钮,切换算法,保证色彩框选中了所有的任务数据
  • 3
    1. 确保账号已登录,访问网站 http://list.iqiyi.com/www/1/2-11—–27397—-2—11-1-1-iqiyi–.html。 2. 点击插件栏上的 图标,启动爬一爬。 3. 点击页面上需要采集的第一列元素。如果色彩框没有包含所有的任务数据, 点击 切换按钮切换算法,直到选中所有的任务数据。本例以电影名称作为第一列元素。 4. 重复上一步骤,选中主演名字,作为第二列元素;选中评分,作为第三列元素。 5. 如果您想采集所有分页的数据,点击分页设置下的箭头按钮。 6. 先选中页面底
    t1w1 2-28
  • 0
    1. 确保账号已登录,访问网站 http://shanghai.anjuke.com/sale/a2-b2-m4/。 2. 点击插件栏上的 图标,启动爬一爬。 3. 点击页面上需要采集的第一列元素。如果色彩框没有包含所有的任务数据, 点击 切换按钮切换算法,直到选中所有的任务数据。 4. 点击column1的“额外属性”按钮,勾选”href”作为连接两个任务的共同元素。 5. 先点击“完成”按钮,再点击“测试”按钮,测试采集的数据是否就是您想要的。 6. 确认测试成功后,点击”OK”关闭测试窗口。 7. 填写
  • 0
    1.在爬一爬官网(http://www.pa1pa.com)首页下载谷歌浏览器插件。 2.在地址栏中输入 chrome://extensions/ 后回车。 或者点击页面右侧按钮->更多工具->扩展程序。 3.把下载好的 Pa1PaChromeExtension.crx 拖入浏览器中“扩展程序”的页面。 4.点击 “添加扩展程序” 之后 图标会出现在右侧插件栏上。 5.在官网上点击登录 Login, 如果您有帐号则请登录, 如果没有帐号请注册并登录。 6. 登录后就可以开始使用爬一爬了。
  • 1
    亲爱的各位吧友:欢迎来到爬一爬数据采集
    t1w1 2-22

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

会员: 会员

目录: