SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫_python教程

上一篇: 干货！这才是学习Python的正确打... 下一篇:扣丁学堂Python培训简述random.r...

SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫

发布时间：2019-06-09 发布网站：脚本宝典

脚本宝典收集整理的这篇文章主要介绍了SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫，脚本宝典觉得挺不错的，现在分享给大家，也给大家做个参考。

项目gIT：https://github.com/lqkweb/sql...

SQLflow (python3+)
Sqlflow based on python development, support to Spark, Flink, etc as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.
2019-01-22 更新界面,近期会规范一下代码,写一些注释并加入读写功能
主页：

结果页面：

项目目标
基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫。
安装python3环境, 执行项目
git clone https://github.com/lqkweb/sql...

      
      
      
      
      
pip install -r requirements.txt
（sqlflow/sqlflow/execute/main.py 中的data.csv需要修改成你电脑中的绝对路径,数据文件在sqlflow/data/中）

      
      
      
      
      
python manage.py
打开http://127.0.0.1:5000 就可以测试了。
项目测试
在http://127.0.0.1:5000/demo输入框输入:
测试1:

      
      
      
      
      
select * From A limit 3;
测试2:

      
      
      
      
      
select * from A limit 3 as B;
新开一个http://127.0.0.1:5000/demo网页, 直接就可以查询数据表B了:

      
      
      
      
      
select * from B limit 2;
as B 相当于创建了一个B临时表。
是不是很简单。
正在新增sql版机器学习算法功能, 谢谢支持。
正在新增sql版爬虫功能, 谢谢支持。
记得给个start鼓励一下！Thanks♪(･ω･)ﾉ