(38条消息) Python读取写入TXT正确姿势

Python 2.7
IDE Pycharm 5.0.3


爬下来,解析,存储,分析,可视化--一气呵成,当然我还在学前面三个哈哈哈

直奔主题


1.自己写入txt

直接上核心代码:

with open("douban.txt","w") as f:        f.write("这是个测试!")

这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!

结果就是这样:


2.将文件输入(print)的内容写入txt

我并不喜欢手写字符,更多时候用到的就是将程序跑出来的print写到txt中保存,比如说刚从豆瓣抓的内容,我想写进去,该怎么保存呢。这就用到了for循环啦。关于豆瓣的爬取请见我的前面那篇博客

我就是想把输出框的文字保存而已

#分模块测试,txt写入测试# -*- coding: utf-8 -*-from selenium import webdriverimport selenium.webdriver.support.ui as uiimport time#driver_item=webdriver.Firefox()driver_item=webdriver.PhantomJS(executable_path="phantomjs.exe")url="https://movie.douban.com/subject/3541415/?tag=%E7%A7%91%E5%B9%BB&from=gaia_video"wait = ui.WebDriverWait(driver_item,10)driver_item.get(url)try:    driver_item.find_element_by_xpath("//img[@class='bn-arrow']").click()    #wait.until(lambda driver: driver.find_element_by_xpath("//div[@class='review-bd']/div[2]/div/div"))    time.sleep(1)    comments_deep = driver_item.find_element_by_xpath("//div[@class='review-bd']/div[2]/div")    print u"深度长评:"+comments_deep.text    #print type(comments_deep.text)#<type 'unicode'>    comments_wr=comments_deep.text.encode('utf-8')    #print type(comments_wr)#<type 'str'>    #title="盗梦空间"#中文命名文件名乱码,内容可用    title="Inception"    with open("%s.txt"%title,"w") as f:#格式化字符串还能这么用!        for i in comments_wr:            f.write(i)except:    print 'can not caught the comments!'

比较常用MODE


不清空连续写入

没有文件时候会自动创建的,但是!如果我重新对此进行写入,那么会先清空,然后再写,就是说以前写的没了,这样搞不好吧,我可是要记录很多东西的啊,万能的a出现了。。。

把核心代码改成这样就可以了,记得把w改成a,至于那个分割线问题,因为后续写入和前面已经有的会混在一块,所以我做分割用:

with open("%s.txt"%title,"a") as f:#格式化字符串还能这么用!        f.write("\n-------------------------------------我是分割线-----------------------------------------\n")        for i in comments_wr:            f.write(i)

效果是这样的,不够好看自己再加细节,比如换行多几次




(0)

相关推荐

  • Python实现数据技术|爬虫便可获取免费百度文库付费文档

    相信大家在百度文档中看到了比较合适的文档之后就有了想下载学习一下的想法,但是有些时候文章更多的需要付费下载,针对于文档中能发现语句是分为一个一个的标签中的文本进行输出的.如果你有耐心和任劳任怨的想法, ...

  • 第69天:Selenium详解

    Selenium 环境配置好之后,我们就可以使用 Selenium 来操作浏览器,做一些我们想做的事情了.在我们爬取网页过程中,经常发现我们想要获得的数据并不能简单的通过解析 HTML 代码获取,这些 ...

  • 用 Jupyter Notebook 爬取微博图片保存本地!

    来源:Python 技术「ID: pythonall」 今天咱们用 Jupyter-Notebook 并结合框架(Selenium)模拟浏览器抓取微博图片并将图片保存本地. Selenium 是一个用 ...

  • Python制作【大麦网】自动抢票程序

    前言 大麦网,是中国综合类现场娱乐票务营销平台,业务覆盖演唱会. 话剧.音乐剧.体育赛事等领域. 但是因为票数有限,还有黄牛们不能丢了饭碗,所以导致了,很多人都抢不到票 那么,今天带大家用Python ...

  • (38条消息) python读取、写入txt文本内容

    读取txt文本 python常用的读取文件函数有三种read().readline().readlines() 以读取上述txt为例,看一下三者的区别 read()    一次性读全部内容 一次性读取 ...

  • (38条消息) python 读取txt中文文本

    txt文本的存储形式有四种ANSI,UTF-8,Unicode,Unicode big endian.后面两种比较少见,说说前面两种吧. 普通的打开文件的操作是这样的: # -*- coding: u ...

  • (38条消息) python读取txt文件(多种方法)

    原始数据:唐诗一百首.txt 方法1: f=open('唐诗一百首.txt', encoding='gbk')txt=[]for line in f: txt.append(line.strip()) ...

  • (10条消息) C++读取写入.txt文件(ifstream/ofstream)

    C++对txt文件的操作是基于fstream/ifstream/ofstream类的,使用时需添加头文件包含: #include<fstream> 针对txt文件的操作大体包括基本的读写, ...

  • (38条消息) Python提示

    原代码 file2 = open('name.txt','r') print(file2) file2.close() 输出后出错 <_io.TextIOWrapper name='name.t ...

  • (3条消息) Python爬取全国高校信息并写入csv

    2021-03-23更新 原来的页面有一些小的改变, 原来的院校特效一列变成了现在的 一流大学建设高校 和一流学科建设高校 两列, 所以代码需要有一些改变,总的代码已经更新了,至于思路那部分就不改了. ...

  • (3条消息) Python实现

    二次函数拟合--最小二乘法公式法 与线性回归相似,对二次函数进行拟合某种意义上也只是加了一个函数,虽然求解的方程变得更加繁琐,需要准备的变量也增加到了七个. 思路有借鉴于:最小二乘法拟合二次曲线 C语 ...

  • (1条消息) python常见图形代码可视化大全整理(包括动图)更新中...

    目录 一.离散型变量的可视化 1 饼图 1.1 matplotlib模块 1.2 panda模块 2 条形图 2.1 matplotlib模块 2.1.1 垂直或水平条形图 2.1.2 堆叠条形图 2 ...

  • (2条消息) Python GUI之tkinter窗口视窗教程大集合(看这篇就够了)

    ahilll 2018-08-09 10:11:22 一.前言 由于本篇文章较长,所以下面给出内容目录方便跳转阅读,当然也可以用博客页面最右侧的文章目录导航栏进行跳转查阅. 一.前言 二.Tkinte ...