当前位置: 首页 > news >正文

【卡码网C++基础课 16.出现频率最高的字母】

目录

  • 题目描述与分析
  • 一、哈希表
  • 二、代码编写


题目描述与分析

题目描述:
给定一个只包含小写字母的字符串,统计字符串中每个字母出现的频率,并找出出现频率最高的字母,如果最高频率的字母有多个,输出字典序靠前的那个字母。

输入描述:
包含多组测试数据,每组测试数据占一行。

输出描述:
有多组输出,每组输出占一行。

输入示例:

2
abcdeef
aabbccddeeff

输出示例:

e
a

之前已经学习了数组、字符串、链表等数据结构,但是如果想要找到其中某个元素或者节点,需要从索引为0的位置或者表头开始,逐一进行比较,直到找到相等的位置或者末尾才会结束。

可以通过“哈希表”来避免之前的比较,直接通过要查找的记录直接找到其存储位置。哈希表是根据关键码key的值而直接进行访问的数据结构。哈希表的作用是快速判断一个元素是否出现在集合里,它的核心思想是在关键码和存储位置之间建立一个确定的对应关系f, 使得每个关键字key对应一个存储位置,而这个对应关系,称之为散列函数(哈希函数)。

其实数组就是一张哈希表,哈希表中关键码就是数组的索引下标,然后通过下标直接访问数组中的元素。
哈希表来解决问题的时候,一般选择以下三种数据结构:
数组
set集合
map映射

一、哈希表

哈希表(Hash Table),也称为散列表,是一种使用哈希函数组织数据,以支持快速插入、查找和删除操作的数据结构。在哈希表中,数据项与一个键(Key)相关联,这些键通过哈希函数转换为数组的索引。

哈希表的基本原理:
1.哈希函数: 哈希函数将输入(通常是键)映射到一个固定大小的数字,这个数字通常是数组的索引。好的哈希函数应尽量减少不同键映射到同一索引的情况(即哈希冲突)。
2.键-值对: 每个键关联一个值,键-值对存储在哈希表的相应索引位置。
3.处理哈希冲突: 最常见的处理哈希冲突的方法包括链地址法(Separate Chaining)和开放寻址法(Open Addressing)。链地址法是通过在每个数组索引处维护一个链表来处理冲突,而开放寻址法则是通过在数组内寻找空闲位置来解决冲突。

哈希表的操作:
1.插入(Add):
计算键的哈希值得到索引。
根据处理冲突的策略将键-值对存储在哈希表中。
2.查找(Search):
计算键的哈希值以找到其可能存储的索引。
遍历该索引对应的链表或数组位置,查找是否存在该键。
3.删除(Delete):
计算键的哈希值找到该键可能存在的索引。
在该索引处找到并移除键-值对。

二、代码编写

照例先把代码的基础结构书写完整

#include <iostream>
#include <string>
using namespace std;
int main() {int n; // 接收n行数据string s; // 每行输入的字符串while(cin >> n) { // 题目包含多个输入while(n--) {cin >> s;// 接收输入的字符串}}
}

数组可以作为简单哈希表来使用,所以我们可以定义一个数组,来记录字符串s当中字符出现的次数。

由于输入的全都是小写字母,小写字母只有26个,那我们定义一个长度为26的数组即可,字符a到字符z的ASCII是26个连续的数值,所以字符a映射为下标0,相应的字符z映射为下标25。
在这里插入图片描述
在遍历 字符串s的时候,只需要将s[i] - 'a’所在的索引做+1 操作即可,并不需要记住字符a的ASCII,只要求出一个相对数值就可以了。 这样就将字符串s中字符出现的次数,统计出来了

// 统计各个字符出现的频率
for (int i = 0; i < s.size(); i++) {count[s[i] - 'a']++;
}

经过一轮遍历之后已经完成统计,数组中各位的元素已经是a-z字母的频次了,如果想要找到最大值,还是需要重新遍历一遍,那我们如何记录这个最大值呢?

只需要先初始化最大值,然后逐一比对字符出现的频次和当前最大值的大小,如果当前字符出现的频次大于最大值,则更新最大值为当前字符出现的频次,这样完整遍历一遍后,就能找到出现频次最大的字符。

// 初始化最大值
int flag = 0;
// 定义出现频次最多的字符为result
char result;
// 遍历数组,找到值最大的索引
for (int i = 0; i < 26; i++) {// 如果当前位置的数值大于最大值,则更新最大值,更新字符if (count[i] > flag) {// 更新最大值flag = count[i];// 更新字符result = i + 'a';}
}
// 输出结果
cout << result << endl;

完整代码如下:

#include <iostream>
#include <string>
using namespace std;
int main() {int n;string s;while (cin >> n) { // 题目中说包含多组测试数据,所以这里要持续输入while (n--) {cin >> s; // 输入字符串int count[26] = {0};// 统计各个字符出现的频率for (int i = 0; i < s.size(); i++) {count[s[i] - 'a']++;}int flag = 0;char result;// 找到出现频率最大的字符for (int i = 0; i < 26; i++) {if (count[i] > flag) {flag = count[i];result = i + 'a';}}cout << result << endl;}}
} 

http://www.mrgr.cn/news/18136.html

相关文章:

  • 惠中科技:开启综合光伏清洗新征程
  • Elasticsearch:使用 inference API 进行语义搜索
  • 自制efficientnet网络
  • 新一代网络研发利器——开物™,让用户每一行代码都贡献在核心创新
  • wlanapi.dll丢失怎么办?有没有什么靠谱的修复wlanapi.dll方法
  • U-Mail垃圾邮件过滤网关‍是如何过滤垃圾邮件的?
  • sql学习 inner join,left join,right join
  • netty编程之基于websocket实现聊天功能
  • 数据结构---五大排序---哈希表---二分查找法
  • 个人的 minimal-mistakes 配置记录
  • .gitignore 修改问题
  • ClimODE——使用神经网络ODE 进行天气预报
  • 零售商商品规划新纪元:全面策略融合与智能计划系统引领未来
  • OceanBase block_file与log过大 的问题
  • tiny_qemu模拟qemu虚拟化原理
  • 基于五种机器学习的某游戏数据分析与胜负预测系统设计与实现,采用Django+MySQL+HTML+CSS实现
  • 大屏自适应解决方案(手写js)
  • [LitCTF 2023]Http pro max plus
  • 使用docker容器部署考试系统
  • 公司注册资本金验资出具验资报告的看法