介绍/理论
生活是艰难的:甚至需要爬……
- Weipa, Weipy, Wepy, 微爬 …… 又是失眠中名字出来了!
- 但是:微爬(Wepy),尽量让您轻松愉快的爬知识,爬价值,爬乐趣!
微爬(Wepy) 介绍
- 微爬(Wepy,Wepthon):是一款轻量、免费、共享的通用Python微框架;适用于CMS开发,爬虫开发!
- 基于 Python, Flask/Blueprint/jinja, Mysql/Sqlite, PyQuery 等开源模块开发
- 基于Blueprint分组扩展,基于MKV的控制器/方法扩展
- 环境需求:Python3+, Flask(Jinja2,Werkzeug), Mysql/Sqlite, PyQuery
微爬(Wepy) 理论
爬,不是偷窃!尊重版权,分享技术!
- 爬,不是偷窃!“尊重版权,分享技术”:仅此而已!
- 生活是艰难的:甚至需要爬……
- 但在这里,爬网页,爬知识,是有乐趣的:缓存网页结果,类似jQuery选择器取资料,多进程执行(折腾中)……
- 我怎么感觉,这个
理论
与“人生苦短,我用Python”非常接近???
微爬(Wepy)责权申明
- 所有爬取的图片文字等资源,版权等属于目标网站或原版权所有者; 这里,仅为演示功能,分享技术!
- 您若在意(爬您图片):请联系 xpigeon#163.com,3工作日内屏蔽;
- 您若使用(本系统)采集东西:欢迎切磋;但请同时尊重(被采集方的)版权,合法使用!
- 多进程:放在Flask中,总出问题(折腾中)……感谢指点!
安装/配置
微爬(Wepy) - 安装配置
- 环境安装
- Python环境:Python3.5+,
- 第三方模块:Flask, Mysql/Sqlite, PyQuery
- 安装Mysql数据库(爬虫要用)
- 安装Mysql数据库
- 导入表数据:/trunk/app/data/wepy.sql
- 配置应用
- 文件:appcfg.ini
- 特别提示:配置链接Mysql数据库
[cdb]
相关参数
- 运行应用
- 直接运行:/trunk/app/web.py
- win模式下,可点 /trunk/run.cmd,直接进入命令行
- 访问:http://127.0.0.1:8026/ (端口可在
appcfg.ini
配置中修改)
目录结构
- 微爬(Wepy) - 目录结构如下。 标记有:Porsonal Test Code! 的,可直接删除!
/branches/ --- Porsonal Test Code!
- /ex100/
- /ex200/
- /hipy/
/trunk/app/ --- 微爬(Wepy)
- /_cache/ - 缓存目录
- /data/ - db, config
- /static/ - js,css 资源
- /views/ - 模板
- /web.py - 运行入口
- /mpa.py - 命令行-多进程运行入口(有点鸡肋味道)
/trunk/blog/ --- 单独blog演示 (v1)
/trunk/core/ --- 核心库包
/trunk/import/ --- 导入库包
/trunk/impui/ --- 外部UI库
/trunk/test/ --- Porsonal Test Code!