Silent Wittgenstein

动手学深度学习当中一些包缺少的问题

发表于2021-04-17|编程环境搭建

缺少d2l包则在目标环境下：pip install -U d2l

更改Jupyter Notebook的初始执行路径

发表于2021-04-17|编程环境搭建

命令行执行：jupyter notebook --generate-config。找到生成的文件位置并打开此文件。按如下图片修改。最后修改Anaconda快捷方式的属性：

Typora+PicGo搭建图床至Github

发表于2021-04-16|编程环境搭建

安装Typora，按照此页面设置，下载PicGo安装至E:\PicGo。参考博客：https://blog.csdn.net/yefcion/article/details/88412025

CUDA与cuDNN

发表于2021-04-16|编程环境搭建

介绍 CUDA: NVIDIA® CUDA® 工具包提供了开发环境，可供创建经 GPU 加速的高性能应用。借助 CUDA 工具包，您可以在经 GPU 加速的嵌入式系统、台式工作站、企业数据中心、基于云的平台和 HPC 超级计算机中开发、优化和部署应用。 cuDNN: NVIDIA® CUDA® Deep Neural Network library™ (cuDNN) is a GPU-accelerated library of primitives for deep neural networks. It provides highly tuned implementations of routines arising frequently in DNN applications. 安装这两样之后会自动拥有NVIDIA® Nsight™ Compute： It is an interactive kernel profiler for CUDA applications. It provides detailed performance metrics and API debuggi ...

Pytorch-tensor

发表于2021-04-15|编程深度学习

快速开始创建tensor 12345678import torchimport numpy as npdata = [[1, 2], [3, 4]]x_data = torch.tensor(data)np_array = np.array(data)x_np = torch.from_numpy(np_array) 创建特殊tensor 1234567891011121314import torch# 返回结果默认保持原数据的类型，可显示指定dtypex_ones = tensor.ones_like(x_data)x_rand = tensor.rand_like(x_data, dtype=torch.float)# 先声明shapeshape (2, 3, )rand_tensor = torch.rand(shape)ones_tensor = torch.ones(shape)zeros_tensor = torch.zeros(shape)# 直接传入shapetensor = torch.rand(3, 4) tensor运算 12345678import torch ...

Python爬虫-数据解析-xpath

发表于2021-04-13|编程Python爬虫

准备 xpath语法：https://www.w3school.com.cn/xpath/xpath_syntax.asp 预安装：lxml模块目标：爬取豆瓣里某本书的若干页评论信息，并将评论信息存储为json文件。 JSON格式： 1234567{ "userID":"rivocky", "itemID":"1", "rate":"4", "comment":"我读加缪第一本书，上来他就讨论自杀，让我觉得不是很high，然而在我看过了第二本，反与正之后，我改变了对他的看法——是要怀着对世界多大的爱才能勇敢的讨论这个问题，加缪是一个从心底到表面都善良的货", "timestamp":"2015-09-24"} 实例引入并以HTML文本生成etree，使用etree.xpath()方法进行数据解析。etree相当于把HTML文本抽象成一个由若干文本节点组成的树，通过 ...

Python爬虫-数据解析-bs4

发表于2021-04-13|编程Python爬虫

准备在Pycharm中安装lxml和bs4模块。 lxml：是一个HTML/XML的解析器，主要的功能是如何解析和提取 HTML/XML 数据 bs4：Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. 常用方法方法参数返回值 BeautifulSoup(file, ‘lxml’) file要么为requests回来的HTML文本，要么为本地open后的文件 bs对象 bs.a a为tag名 bs中第一个a标签文本 bs.find(tagName, class_=None) tagName为HTML标签名，class_为类名符合条件的第一个标签文本 bs.find_all(tagName, class_=None) 同上所有指定标签组成的列表 bs.select(“.className > tagName li”) 字符串表示一个层级关系，此示例表示类className下 ...

Python爬虫-数据解析-正则方法

发表于2021-04-13|编程Python爬虫

目标：从当当网的图书排行榜中，爬取全部25页的图书名。技巧：通过翻页查看网页URL变化，推断页数和URL的关系。通过所要爬取内容周围HTML文本的特点，写正则表达式提取特定内容。使用正则表达式需要引入re模块 12345678910111213141516171819202122232425262728293031import requestsimport re"""<div class="name"><a href="http://product.dangdang.com/29168581.html" target="_blank" title="医路向前巍子给中国人的救护指南">医路向前巍子给中国人的救护指南</a></div>"""if __name__ == "__main__": url = "http://bang.dangdang. ...

Python爬虫-正则表达式入门

发表于2021-04-12|编程Python爬虫

正则表达式简介正则表达式：用于描述特定字符串模式的表达式。元字符为M1, M2, ...，数量修饰符为N1, N2, ... 常见正则表达式形式则为M1N1M2N2... 元字符含义 . 处\n外任意字符 [0-9] 数字 [A-Z] 大写字母 [a-z] 小写字母 [0-9a-zA-Z] 数字或字母 \d 数字 \w 字母 \s 空白符 \需转义字符需转义字符 a a ab1 ab1 12 12 数量修饰符含义 {n} 重复n次 {m, n} 重复m-n次 * 重复0,1或任意次 + 重复1或任意次 ? 重复0次或1次位置修饰符含义 ^ ^\d表示以一个数字开头 $ \w$表示以一个字母结尾技巧在正则表达式中加入()来提取子串。如：将a(\d{3})a作用到a111a上面会得到111。正则表达式默认为贪婪匹配(能匹配的结果中取最长那个)。若要切换到非贪婪匹配则在数量修饰符后加上?。 .*代表任意长度的字符，默认匹配最大长度 ...

Python爬虫-requests模块

发表于2021-04-08|编程Python爬虫

requests模块参考网站：https://docs.python-requests.org/zh_CN/latest/user/quickstart.html 在Pycharm中安装requests模块 File --> Settings --> Projects:[name] --> Python Interpreter --> 下方+ --> 搜索requests模块并安装实例一目标：抓取目标URL的HTML源码。 12345678910111213141516import requestsif __name__ == '__main__': # 1. 指定url url = 'https://www.taobao.com' # 2. 请求数据 # 此步返回一个响应对象 response = requests.get(url) # 3. 获取响应数据 # response.text为响应的字符串数据 page_text = response.text ...