动手学深度学习当中一些包缺少的问题
缺少d2l包则在目标环境下:pip install -U d2l
更改Jupyter Notebook的初始执行路径
命令行执行:jupyter notebook --generate-config。
找到生成的文件位置并打开此文件。
按如下图片修改。
最后修改Anaconda快捷方式的属性:
Typora+PicGo搭建图床至Github
安装Typora,按照此页面设置,下载PicGo安装至E:\PicGo。
参考博客:https://blog.csdn.net/yefcion/article/details/88412025
CUDA与cuDNN
介绍
CUDA: NVIDIA® CUDA® 工具包提供了开发环境,可供创建经 GPU 加速的高性能应用。借助 CUDA 工具包,您可以在经 GPU 加速的嵌入式系统、台式工作站、企业数据中心、基于云的平台和 HPC 超级计算机中开发、优化和部署应用。
cuDNN: NVIDIA® CUDA® Deep Neural Network library™ (cuDNN) is a GPU-accelerated library of primitives for deep neural networks. It provides highly tuned implementations of routines arising frequently in DNN applications.
安装这两样之后会自动拥有NVIDIA® Nsight™ Compute: It is an interactive kernel profiler for CUDA applications. It provides detailed performance metrics and API debuggi ...
Pytorch-tensor
快速开始
创建tensor
12345678import torchimport numpy as npdata = [[1, 2], [3, 4]]x_data = torch.tensor(data)np_array = np.array(data)x_np = torch.from_numpy(np_array)
创建特殊tensor
1234567891011121314import torch# 返回结果默认保持原数据的类型,可显示指定dtypex_ones = tensor.ones_like(x_data)x_rand = tensor.rand_like(x_data, dtype=torch.float)# 先声明shapeshape (2, 3, )rand_tensor = torch.rand(shape)ones_tensor = torch.ones(shape)zeros_tensor = torch.zeros(shape)# 直接传入shapetensor = torch.rand(3, 4)
tensor运算
12345678import torch ...
Python爬虫-数据解析-xpath
准备
xpath语法:https://www.w3school.com.cn/xpath/xpath_syntax.asp
预安装:lxml模块
目标:爬取豆瓣里某本书的若干页评论信息,并将评论信息存储为json文件。
JSON格式:
1234567{ "userID":"rivocky", "itemID":"1", "rate":"4", "comment":"我读加缪第一本书,上来他就讨论自杀,让我觉得不是很high,然而在我看过了第二本,反与正之后,我改变了对他的看法——是要怀着对世界多大的爱才能勇敢的讨论这个问题,加缪是一个从心底到表面都善良的货", "timestamp":"2015-09-24"}
实例
引入并以HTML文本生成etree,使用etree.xpath()方法进行数据解析。etree相当于把HTML文本抽象成一个由若干文本节点组成的树,通过 ...
Python爬虫-数据解析-bs4
准备
在Pycharm中安装lxml和bs4模块。
lxml:是一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML 数据
bs4:Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.
常用方法
方法
参数
返回值
BeautifulSoup(file, ‘lxml’)
file要么为requests回来的HTML文本,要么为本地open后的文件
bs对象
bs.a
a为tag名
bs中第一个a标签文本
bs.find(tagName, class_=None)
tagName为HTML标签名,class_为类名
符合条件的第一个标签文本
bs.find_all(tagName, class_=None)
同上
所有指定标签组成的列表
bs.select(“.className > tagName li”)
字符串表示一个层级关系,此示例表示类className下 ...
Python爬虫-数据解析-正则方法
目标:从当当网的图书排行榜中,爬取全部25页的图书名。
技巧:
通过翻页查看网页URL变化,推断页数和URL的关系。
通过所要爬取内容周围HTML文本的特点,写正则表达式提取特定内容。
使用正则表达式需要引入re模块
12345678910111213141516171819202122232425262728293031import requestsimport re"""<div class="name"><a href="http://product.dangdang.com/29168581.html" target="_blank" title="医路向前巍子给中国人的救护指南">医路向前巍子给中国人的救护指南</a></div>"""if __name__ == "__main__": url = "http://bang.dangdang. ...
Python爬虫-正则表达式入门
正则表达式简介
正则表达式:用于描述特定字符串模式的表达式。元字符为M1, M2, ...,数量修饰符为N1, N2, ...
常见正则表达式形式则为M1N1M2N2...
元字符
含义
.
处\n外任意字符
[0-9]
数字
[A-Z]
大写字母
[a-z]
小写字母
[0-9a-zA-Z]
数字或字母
\d
数字
\w
字母
\s
空白符
\需转义字符
需转义字符
a
a
ab1
ab1
12
12
数量修饰符
含义
{n}
重复n次
{m, n}
重复m-n次
*
重复0,1或任意次
+
重复1或任意次
?
重复0次或1次
位置修饰符
含义
^
^\d表示以一个数字开头
$
\w$表示以一个字母结尾
技巧
在正则表达式中加入()来提取子串。如:将a(\d{3})a作用到a111a上面会得到111。
正则表达式默认为贪婪匹配(能匹配的结果中取最长那个)。若要切换到非贪婪匹配则在数量修饰符后加上?。
.*代表任意长度的字符,默认匹配最大长度 ...
Python爬虫-requests模块
requests模块参考网站:https://docs.python-requests.org/zh_CN/latest/user/quickstart.html
在Pycharm中安装requests模块
File --> Settings --> Projects:[name] --> Python Interpreter --> 下方+ --> 搜索requests模块并安装
实例一
目标:抓取目标URL的HTML源码。
12345678910111213141516import requestsif __name__ == '__main__': # 1. 指定url url = 'https://www.taobao.com' # 2. 请求数据 # 此步返回一个响应对象 response = requests.get(url) # 3. 获取响应数据 # response.text为响应的字符串数据 page_text = response.text ...