当前位置: 首页 > news >正文

Python写一个文件自动计数工具

目录

脚本说明

使用说明

扩展功能


创建一个能够自动计数文件行数、单词数和字符数的Python工具,可以帮助博主和写作者轻松跟踪他们的内容量。这个工具还可以扩展以提供更多功能,如统计特定关键字出现的次数。

以下是一个较为完整的Python脚本,它可以实现上述功能,并带有适当的注释,以帮助理解和扩展。

import os

def count_lines(file_path):
    """计算文件中的行数"""
    with open(file_path, 'r', encoding='utf-8') as file:
        lines = file.readlines()
        return len(lines)

def count_words(file_path):
    """计算文件中的单词数"""
    with open(file_path, 'r', encoding='utf-8') as file:
        words = file.read().split()
        return len(words)

def count_characters(file_path):
    """计算文件中的字符数"""
    with open(file_path, 'r', encoding='utf-8') as file:
        content = file.read()
        return len(content)

def count_keyword(file_path, keyword):
    """统计特定关键字在文件中出现的次数"""
    with open(file_path, 'r', encoding='utf-8') as file:
        content = file.read()
        return content.lower().count(keyword.lower())

def file_stats(file_path):
    """输出文件的所有统计数据"""
    print(f"文件: {file_path}")
    print(f"行数: {count_lines(file_path)} 行")
    print(f"单词数: {count_words(file_path)} 个单词")
    print(f"字符数: {count_characters(file_path)} 个字符")

def main():
    """主函数,处理用户输入和调用统计函数"""
    file_path = input("请输入文件的路径: ")

    if not os.path.isfile(file_path):
        print("文件路径无效,请重新输入")
        return

    file_stats(file_path)

    # 询问用户是否要统计特定关键字的出现次数
    keyword = input("请输入要统计的关键字(或按Enter跳过): ")
    if keyword:
        keyword_count = count_keyword(file_path, keyword)
        print(f"关键字 '{keyword}' 出现了 {keyword_count} 次")

if __name__ == "__main__":
    main()
 

脚本说明

  1. count_lines: 计算文件中的行数。通过读取文件的所有行并计算行数来实现。
  2. count_words: 计算文件中的单词数。通过将文件内容拆分为单词列表并计算单词数来实现。
  3. count_characters: 计算文件中的字符数。通过读取整个文件内容并计算字符数来实现。
  4. count_keyword: 统计特定关键字在文件中出现的次数。通过读取文件内容并使用字符串的count方法来实现。
  5. file_stats: 输出文件的所有统计数据。
  6. main: 主函数,处理用户输入,并调用上述函数来输出统计数据。如果用户输入了关键字,则统计其出现次数。

使用说明

  1. 运行脚本,会提示你输入文件路径。
  2. 输入有效的文件路径后,脚本会输出该文件的行数、单词数和字符数。
  3. 脚本还会询问你是否要统计特定关键字的出现次数。如果输入关键字,脚本会统计并输出该关键字在文件中出现的次数。

扩展功能

  • 文件类型检查:添加对文件类型的检查,只处理文本文件。
  • 批量处理:扩展脚本以处理多个文件或目录中的所有文件。
  • 输出格式:将统计结果导出为CSV或其他格式,便于进一步分析。

通过这个工具,你可以轻松跟踪和分析你的博文或其他文本文件的内容量。希望这个脚本对你有帮助!


http://www.mrgr.cn/news/24951.html

相关文章:

  • [Python学习日记-16] 细讲数据类型——元组
  • MongoDB 原子操作
  • [Python学习日记-12] Python中的流程控制(for)
  • 查询国内版Office 365邮件数量的详细指南
  • 详细分析Uniapp中的轮播图基本知识(附Demo)
  • Linux read命令详解使用
  • SOMEIP_ETS_104: SD_ClientServiceGetLastValueOfEventUDPMulticast
  • 2024年9月9日--9月15日(freex源码抄写+ue5肉鸽视频一节调节)
  • JVM锁的优化与逃逸分析
  • Java爬虫 爬取某招聘网站招聘信息
  • 【3.5 python中的numpy实现3层的神经网络】
  • C++中的for-each循环
  • C++力扣简单算法题整理-2(字符串、数组)
  • 一天认识一个硬件之主板
  • 资源监视器
  • 计算机毕业设计2025题目出炉,如何选择和流程分析看这一篇就够了
  • mysql 学习笔记三
  • MAC 地址简化概念(有线 MAC 地址、无线 MAC 地址、MAC 地址的随机化)
  • 04 Room
  • 软件测试中的黑盒测试方法,包括其定义、目的及主要步骤。