和平鸽

1979-09-13 ~ 2039-09-14(预计)

健康第一,学无止境;努力工作,积极生活。

网络无垠,技术无界;知识无价,生命无悔。

尊重版权,共享技术;至轻、至简 --- 贴心猫(IntimateCat)!

工作:愿[企业,个人,客户]三方利益达到最佳平衡。

死:愿意捐献器官,捐献遗体;愿一切从简。

 
 

微爬(Wepy)---Python微框架

发布: 2018-05-10 21:20 标签: 微爬,Wepy,Python

介绍/理论

生活是艰难的:甚至需要爬……

  • Weipa, Weipy, Wepy, 微爬 …… 又是失眠中名字出来了!
  • 但是:微爬(Wepy),尽量让您轻松愉快的爬知识,爬价值,爬乐趣!

微爬(Wepy) 介绍

  • 微爬(Wepy,Wepthon):是一款轻量、免费、共享的通用Python微框架;适用于CMS开发,爬虫开发!
  • 基于 Python, Flask/Blueprint/jinja, Mysql/Sqlite, PyQuery 等开源模块开发
  • 基于Blueprint分组扩展,基于MKV的控制器/方法扩展
  • 环境需求:Python3+, Flask(Jinja2,Werkzeug), Mysql/Sqlite, PyQuery

微爬(Wepy) 理论

爬,不是偷窃!尊重版权,分享技术!

  • 爬,不是偷窃!“尊重版权,分享技术”:仅此而已!
  • 生活是艰难的:甚至需要爬……
  • 但在这里,爬网页,爬知识,是有乐趣的:缓存网页结果,类似jQuery选择器取资料,多进程执行(折腾中)……
  • 我怎么感觉,这个理论与“人生苦短,我用Python”非常接近???

微爬(Wepy)责权申明

  • 所有爬取的图片文字等资源,版权等属于目标网站或原版权所有者; 这里,仅为演示功能,分享技术!
  • 您若在意(爬您图片):请联系 xpigeon#163.com,3工作日内屏蔽;
  • 您若使用(本系统)采集东西:欢迎切磋;但请同时尊重(被采集方的)版权,合法使用!
  • 多进程:放在Flask中,总出问题(折腾中)……感谢指点!

安装/配置

微爬(Wepy) - 安装配置

  • 环境安装
    • Python环境:Python3.5+,
    • 第三方模块:Flask, Mysql/Sqlite, PyQuery
  • 安装Mysql数据库(爬虫要用)
    • 安装Mysql数据库
    • 导入表数据:/trunk/app/data/wepy.sql
  • 配置应用
    • 文件:appcfg.ini
    • 特别提示:配置链接Mysql数据库 [cdb] 相关参数
  • 运行应用
    • 直接运行:/trunk/app/web.py
    • win模式下,可点 /trunk/run.cmd,直接进入命令行
    • 访问:http://127.0.0.1:8026/ (端口可在appcfg.ini配置中修改)

目录结构

  • 微爬(Wepy) - 目录结构如下。 标记有:Porsonal Test Code! 的,可直接删除!
    /branches/                 --- Porsonal Test Code!
      - /ex100/          
      - /ex200/          
      - /hipy/           
    /trunk/app/                --- 微爬(Wepy)
      - /_cache/       - 缓存目录
      - /data/         - db, config
      - /static/       - js,css 资源
      - /views/        - 模板
      - /web.py       - 运行入口
      - /mpa.py       - 命令行-多进程运行入口(有点鸡肋味道)
    /trunk/blog/               --- 单独blog演示 (v1)
    /trunk/core/               --- 核心库包
    /trunk/import/             --- 导入库包
    /trunk/impui/              --- 外部UI库
    /trunk/test/               --- Porsonal Test Code!