Python在金融领域的应用与创新 王宇韬
GUICHENG TRUST CORPORATION LTD. Python舆情监控 HUANENG GUICHENG TRUST CORPORATION LTD. 四行代码爬取Python官网: # 爬虫初尝试 import requests url = 'https://www.python.org' res = requests.get(url).text print(res) 源代码公布平台 + ‘百度新闻爬取失败') time.sleep(3600) 舆情评分系统 HUANENG GUICHENG TRUST CORPORATION LTD. 1. 数据乱码的处理 当我们通过爬虫获得的编码和网址实 际的编码UTF-8不一致时,就会导致怕 去的数据出现乱码的现象。 通过右面的代码,进行多次编码解码 尝试,可以解决乱码的问题。 import requests url = TRUST CORPORATION LTD. 《Python金融大数据挖掘与分析实战》 《Python大数据分析与机器学习商业案例实战》 《Python智能AI机器人商业实战》 《零基础Python爬虫从入门到精通》 《Python量化金融-智能选股策略实战》 华能信托-华小智慈善信托计划 HUMANS ARE CREATIVE BEINGS. IF IT IS NOT REAL TEXT,0 码力 | 51 页 | 4.69 MB | 1 年前31 藤井美娜 Python的NLP实战分享 如何实现合同风险预测模型
13% |########### | section1 收集语料 前处理 分词 语义解析 • 使用爬虫收集的语言数据 • 公司拥有的语言数据 NLP基础 15% |############# | section1 收集语料 前处理 分词 语义解析 • 使用爬虫收集的语言数据 • 公司拥有的语言数据 • 根据你的目的删掉一些不需要的 特殊符号,例如 ①②③《 》等。 NLP基础 16% |############## | section1 收集语料 前处理 分词 语义解析 • 使用爬虫收集的语言数据 • 公司拥有的语言数据 • 根据你的目的删掉一些不需要的 特殊符号,例如 ①②③《 》等。 NLP基础 18% |############### | section1 收集语料 前处理 分词 向量化 机器学习模型 各种OUTPUT0 码力 | 36 页 | 3.95 MB | 1 年前38 4 Deep Learning with Python 费良宏
1.5 年 Cloud Computing @ 技术关注: 云计算:架构、大数据、计算优化 机器学习:深度学习、自然语言处理 语言:Python、Go、Scala、Lua Web:爬虫 2016的目标:Web爬虫+深度学习+自然语言处理 = ? Microso� Apple AWS 今年最激动人心的事件? 2016.1.28 “Mastering the game of Go with0 码力 | 49 页 | 9.06 MB | 1 年前3Spark 简介以及与 Hadoop 的对比
物化,控制中间结果的存储、分区等。可以说编程模型比 Hadoop 更灵活。 3. 由于 RDD 的特性,Spark 不适用那种异步细粒度更新状态的应用,例如 web 服务的存 储或者是增量的 web 爬虫和索引。就是对于那种增量修改的应用模型不适合。 2.3 容错性 在RDD计算,通过checkpoint进行容错,做checkpoint有两种方式,一个是checkpoint data,一个是0 码力 | 3 页 | 172.14 KB | 1 年前32 张孝峰 Python与云 AWS的Python原生应用浅析
2004 AWS Lambda 2014/11 2019/10 22个区域 165项服务 Python被称为“瑞士军刀” • Web开发 • AI / 机器学习 • 自动化运维 • 网络爬虫 • 大数据分析 48 82 160 280 516 722 1017 1430 1,957 2009 2011 2012 2013 2014 2015 2016 2017 20180 码力 | 42 页 | 8.12 MB | 1 年前3机器学习课程-温州大学-机器学习项目流程
对最佳模型执行超参数调 整 • 在测试集上评估最佳模型 • 解释模型结果 • 得出结论 • 数据清理和格式化 • 探索性数据分析(EDA) • 特征工程 • 特征选择 • 网络下载 • 网络爬虫 • 数据库读取 • 开放数据 • …… 7 2.数据清洗 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 8 2.数据清洗 什么是数据清洗?0 码力 | 26 页 | 1.53 MB | 1 年前33 Python的NLP实战分享 如何实现合同风险预测模型 藤井美娜
简单介绍自然语言处理的流程和使用corpus的EDA方法。 8% |##### | section1 NLP基础 11% |####### | section1 收集语料 前处理 分词 语义分析 • 使用爬虫收集的语言数据 • 公司拥有的语言数据 • 根据你要达到的目的删掉一些 不需要的东西,例如①②③; 《 》等特殊符号。 • 确认需不需要分隔词素 • 词语 • 短语 • 句子 • 文0 码力 | 33 页 | 1.67 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
DWS(公共汇总) 敏捷开发平台 数据集成工具 数据地图 数据血缘 数据质量中心 数据资产管理 用户画像 数字化运营 数字化管理 数字化供应链 数据后台 数据源 数据库 埋点采集 服务器日志 爬虫数据 SOLUTIONS 数据中台,构建在数据湖之上,连接孤岛数据,构建统一的指标管理和抽象数据公共层,对外通过接口提供数据服务。 数据中台解决方案 26 方案价值 方案特色 打造金融级分布式技术平台0 码力 | 43 页 | 884.64 KB | 1 年前3Go Web编程
Match模式只能用来对字符串的判断,而无法截取字符串的一部分、过滤字符串、或者提取出符合条件的一批字符 串。如果想要满足这些需求,那就需要使用正则表达式的复杂模式。 我们经常需要一些爬虫程序,下面就以爬虫为例来说明如何使用正则来过滤或截取抓取到的数据: package main import ( 161 "fmt" "io/ioutil" "net/http"0 码力 | 295 页 | 5.91 MB | 1 年前3跟我学Shiro - 张开涛
iro的对外API核心就是Subject; 其每个 API 的含义: Subject:主体,代表了当前“用户”,这个用户不一定是一个具体的人,与当前应用交互 的任何东西都是 Subject,如网络爬虫,机器人等;即一个抽象概念;所有 Subject 都绑定 到 SecurityManager,与 Subject 的所有交互都会委托给 SecurityManager;可以把 Subject 认 为0 码力 | 219 页 | 4.16 MB | 10 月前3
共 97 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10