LeetCode - Anagrams

本文介绍了一种通过排序字符串并按字母顺序分组的方法来识别一组字符串中的字母组合。使用了C++实现,并讨论了时间复杂性和空间复杂度。

Anagrams

2013.12.15 22:00

Given an array of strings, return all groups of strings that are anagrams.

Note: All inputs will be in lower-case.

Solution:

  Anagrams means that strings composed of the same group of letters, such as [ate, eat, tea]. They'll become the same when sorted: aet.

  My solution is to sort every string, and sort the array according to the sorted form of each string element. Then group the strings together by anagrams.

  Time compexity is O(n * log(n)), where n is the length of the array. Space complexity is O(n).

Accepted code:

 1 // 1CE, 1AC
 2 #include <algorithm>
 3 #include <cstring>
 4 #include <string>
 5 using namespace std;
 6 
 7 typedef struct st{
 8 public:
 9     string str;
10     string sorted_str;
11     
12     st(string _str = "", string _sorted_str = "") {
13         str = _str;
14         sorted_str = _sorted_str;
15     }
16 }st;
17 
18 bool comparator(const st &x, const st &y)
19 {
20     // 1CE here, return a.sorted_str < b.sorted_str;
21     return x.sorted_str < y.sorted_str;
22 }
23 
24 class Solution {
25 public:
26     vector<string> anagrams(vector<string> &strs) {
27         // IMPORTANT: Please reset any member data you declared, as
28         // the same Solution instance will be reused for each test case.
29         int max_len = 0;
30         int i, j, n;
31         char *ps = nullptr;
32         
33         result.clear();
34         v.clear();
35         
36         n = strs.size();
37         if(n <= 0){
38             return result;
39         }
40         for(i = 0; i < n; ++i){
41             if(strs[i].length() > max_len){
42                 max_len = strs[i].length();
43             }
44         }
45         ps = new char[max_len + 1];
46         
47         string s, ss;
48         for(i = 0; i < n; ++i){
49             s = strs[i];
50             strcpy(ps, s.data());
51             sort(ps, ps + s.length());
52             ss = string(ps);
53             v.push_back(st(s, ss));
54         }
55         sort(v.begin(), v.end(), comparator);
56         delete[] ps;
57         i = 0;
58         while(i < n){
59             j = i;
60             while(j < n && v[i].sorted_str == v[j].sorted_str){
61                 ++j;
62             }
63             if(j - i > 1){
64                 while(i < j){
65                     result.push_back(v[i].str);
66                     ++i;
67                 }
68             }
69             i = j;
70         }
71         v.clear();
72         
73         return result;
74     }
75 private:
76     vector<st> v;
77     vector<string> result;
78 };

 

转载于:https://www.cnblogs.com/zhuli19901106/p/3475842.html

多源数据接入 支持校园各业务系统数据接入:包括教务系统(学生成绩、课程信息)、学工系统(奖惩记录、资助信息)、后勤系统(宿舍分配、能耗数据)、图书馆系统(借阅记录、馆藏信息)、一卡通系统(消费数据、门禁记录)等。 接入方式:提供数据库直连(MySQL、SQL Server)、文件导入(CSV、Excel、JSON)、API 接口调用等多种方式,支持实时同步与定时批量同步。 数据标准化与治理 建立校园数据标准体系:统一数据格式(如日期格式、学号编码规则)、定义核心数据元(如 “学生” 包含学号、姓名、专业等必选字段)、规范代码集(如性别代码 “1 - 男,2 - 女”)。 数据清洗:自动检测并处理缺失值、重复值、异常值(如成绩 > 100 分),通过规则引擎实现数据校验(如 “学生年龄需在 16-30 岁之间”)。 元数据管理:记录数据来源、格式、更新频率、负责人等信息,生成数据血缘图谱,追踪数据从产生到应用的全生命周期。 二、数据共享与交换核心功能 分布式数据存储 基于 Hadoop HDFS 实现海量数据存储:结构化数据(成绩、消费记录)存入 HBase,非结构化数据(文档、图片、视频)直接存储于 HDFS,日志类数据通过 Flume 采集至 HDFS。 支持数据分片与副本机制,确保数据高可用(默认 3 副本存储),满足校园 PB 级数据存储需求。 数据交换引擎 构建点对点数据交换通道:各部门系统可通过交换引擎向平台上传数据或申请获取授权数据,支持同步 / 异步交换模式。 交换流程管理:定义数据交换规则(如 “学工系统每日向平台同步新增学生信息”),记录交换日志(成功 / 失败状态、数据量),失败时自动重试。 数据脱敏:对敏感数据(如身份证号、银行卡号)在交换过程中进行脱敏处理(如显示 “110********5678”),兼顾共享与隐私保护。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值