- 博客(82)
- 收藏
- 关注
原创 手机通话语音离线ASR识别商用和优化方向
至此,本轮Android手机中应用App加载FunASR模型文件和ASR识别的工作暂且告一段落。与2023年末的版本相比,引入了【asr_online】和【punc】模型文件,通过增大App运行内存的方式,提高了ASR识别的响应速度并提高了识别的准确度。总体来说,也算基本达到了预期的效果,初步可以满足试用的需求。
2025-07-06 16:56:58
718
原创 手机FunASR识别SIM卡通话占用内存和运行性能分析
本文中尝试从内存占用和运行性能的角度,分析一下将FunASR的运行动态库以及模型文件,直接加载到Android后在CPU性能、内存耗用方面的使用情况。进而分析Android手机直接使用FunASR模型进行本地解析是否靠谱。从结果上来看,目前选型的模型库和算法,对SIM卡电话通话事后根据录音进行质检方面效果比较理想。
2025-07-06 10:37:33
701
原创 手机无网离线使用FunASR识别SIM卡语音通话内容
本文将FunASR的模型文件和调用入口都放入Android手机中,使手机在无网离线使用的情况下,也能实现对SIM卡电话通话中双方语音沟通内容的ASR解析。但是目前看来,将FunASR完全部署到Android手机上,仅利用手机CPU的主频性能,对上行/下行两路语音数据进行ASR文字识别,效果上还是差强人意,有待后续进一步优化和性能提升。
2025-07-05 14:35:31
1098
原创 手机无网离线使用FunASR识别手机历史通话录音
本篇章针对不同厂商和型号的手机内置录音的文件,使用FunASR进行语音转文字,将手机中预先录制的通话记录,逐条转换解析出对应的通话语音文字。此部分功能只做了历史通话的ASR转换,有需要的用户可以直接拿来体验和使用。语音文件检测作为FunASR的主要应用场景,它的识别精度准确率和识别效率都还是非常好的。
2025-07-05 10:03:44
1167
原创 Android手机无网离线使用FunASR识别麦克风语音内容
本文使用前面几篇文章中阐述的理论,简单的将阿里FunASR的模型装进普通的Android手机中,并使用手机麦克风来体验ASR语音文字识别的效果。经检验,识别的响应速度和文字内容的准确率相当的不错。
2025-07-04 17:04:30
687
原创 阿里FunASR本地断网离线识别模型简析
本文对FunASR断网离线识别模型移植到Android应用进行初步探索,并尝试建立一个能用的手机ASR离线识别的方案。从结果来看,总的来说结果也算勉强能用吧,识别的准确率还算可以。感兴趣的读者朋友可以获取对应的代码和模型文件进行试用和体验。
2025-07-04 10:05:26
977
原创 手机SIM卡通话中随时插入录音语音片段(Windows方案)
本文在原来【拦截手机打电话的声音、根据通话对方声音提取DTMF字符、多级IVR语音导航菜单】等基础之上,在Windows版本的远程“拨号器声音”程序中增加了通话中【随机插播预录语音片段】的功能。可以搭配手机版本的【拨号器SDK-示例App】程序,插入USB蓝牙后,进行协同工作。
2025-06-16 09:06:18
1028
原创 手机SIM卡通话中随时插入录音语音片段(Android方案)
前几天有试用的朋友咨询问,既然通话接通后有IVR开场白语音、有IVR语音导航菜单,那能不能实现我正常通话沟通的时候随机插播一个预先录制的语音片段呢?我们分析了一下,正常电话的用户应该是没有这种需求的。但是想想,做起来又不复杂,干脆就“画蛇添足”一番,把这个【随机插播预录语音片段】的功能给添加到界面上。供某些特殊场景有需要的用户,可以直接拿来使用。
2025-06-16 08:59:13
994
3
原创 ADB识别手机系统弹授权框-如何处理多重弹框叠加和重叠问题
本文针对【多重弹框叠加和重叠问题】进行理论上的探讨,尝试发现和寻觅到一种标准化的办法来针对性的处理这种场景的方式。由于蓝牙电话方案依赖外置USB硬件的拔插,因此权限请求和原有应用App的常规权限请求之间,也确实存在一定的重叠的冲突。这个在后续应用App的逻辑和功能实现中需要着重进行考虑。
2025-06-07 14:47:42
1121
原创 手机App-插入USB时自动授权点击确定按钮-使系统弹出框自动消失
本文使用前述文章列举的理论和原理,最终实现了【插入外置USB配件后系统弹出USB授权弹窗】的自动点击操作。并将这个功能给统一整合到【蓝牙电话方案-拨号器SDK】中,使基于其上的普通应用App能够对弹窗文本进行识别,识别成功后将自动点击其“确定”或“允许”按钮。通过在普通App中整合此类功能,可快速通过一些因Android授权弹框而阻塞App自动运行的过程,减少了人工行为的干预从而降低操作复杂度。
2025-06-07 06:00:45
873
原创 App识别安卓系统弹授权框包含某段文字-并自动点击确定按钮
本文将尝试探索Android系统弹出框的识别,并在普通App中增加自动确认使其消失的功能。借助ADB的控制指令,本文的方案可根据弹框标题或内容中包含某个关键字来进行预期弹框类型的判断,识别成功后将自动点击其“确定”或“允许”按钮。通过在普通App中整合此类功能,可快速通过一些因Android授权弹框而阻塞App自动运行的过程,减少了人工行为的干预。在不改变手机操作系统和业务逻辑的情况下,能更大程度的减少操作复杂度。具有一定的现实意义。
2025-05-29 18:00:38
913
原创 手机打电话时将对方DTMF数字转为RFC2833发给局域网SIP坐席
本文是为了简化SIP平台的部署难度,针对SIM卡电话通话中的DTMF按键的信息,在蓝牙电话SDK到SIP平台的这一段通路中,将蓝牙电话SDK解码出来的DTMF数字,通过RFC2833的协议,通过rtp将DTMF又多发了一份给SIP平台。使SIP平台可以不用特意专门去解析In-band带内DTMF,即可正常获取到对方的按键值。
2025-05-29 09:54:09
1012
原创 手机打电话时由对方DTMF响应切换多级IVR语音菜单(完结)
本文在上一篇的手机上实现了“打电话时由对方DTMF响应切换多级IVR语音菜单”功能的基础之上,锦上添花的增加了多级IVR菜单的上传和下载功能。使同一用户的多个不同的手机设备,能够快捷的使用同样的IVR引导菜单统一对外提供业务和功能服务。这样有利于业务的快速部署并消除服务的体验差异。对业务起到一定程度的帮助。
2025-05-22 14:50:48
1338
原创 手机打电话时由对方DTMF响应切换多级IVR语音菜单(话术脚本与实战)
本篇中,我们通过预设的话术脚本,设计了自己的DTMF响应逻辑。并通过在线TTS和语料转换,实现将脚本文字转换为一段一段语音,并将它们成功导入了【蓝牙电话SDK示例App】中进行使用。我们可以通过主界面中对多级IVR菜单的逻辑和响应内容进行编辑,并提供了不用打通电话就可以直接检验和验证IVR菜单的体验效果的途径。另外,由于本篇章的所有的逻辑和代码均属于【示例App】的功能范畴,开源的。感兴趣的读者可以获取源代码,在这个基础上进行修改以适配自己的话术和逻辑。
2025-05-22 10:07:07
970
原创 手机打电话时由对方DTMF响应切换多级IVR语音应答(二)
本篇章中,我们尝试在拨号器SDK的示例App中,通过界面列表的方式,将多级IVR的编辑界面内容给标注出来,使SDK-Demo的App,能够按用户自己的需要,手动编辑各种层级的IVR的DTMF按键响应的语料。从而实现一个完整的“手机SIM卡挂载多级IVR实现主动外呼或来电接听时根据通话对方不同的DTMF按键,实现播放不同IVR语音反馈”的实际功能。
2025-05-17 15:58:25
1280
原创 手机打电话时如何将通话对方的声音在手机上识别成文字
我们尝试在蓝牙电话SDK中,引入一些跟AI方向相关的算法和能力。本篇章中,我们想突破传统的业内“端+云”的做法,想仅仅依靠端侧的算力(毕竟智能手机处理性能这么强,存储空间又大)来独立完成ASR语音转文字的功能。目前从实践的结果来看,算法和模型库不给力啊。当前暂时没有发现能够直接移植到手机、且完全不依赖网络,并能够获得比较良好的ASR识别的算法和模型库。
2025-05-17 13:00:27
1007
原创 手机打电话时由对方DTMF响应切换多级IVR语音应答(一)
在本篇及后面的几篇,我们将针对多级IVR语音导航的功能,规划出一个可用的界面及操作App出来,使同一个用户,名下所有的手机,都能使用同一套多级IVR语音来进行单机化的部署。(会不会把它引导到云平台上,然后用多并发的方式来实现更加容易?但这个不是本次主题讨论的范畴,我们默认就已经具备了这个云平台功能,本次只讨论单机版)
2025-05-05 22:02:21
1133
原创 手机SIM卡打电话时识别对方按下的DTMF按键(二)
本篇章中,我们将DTMF解码器的功能,整合到蓝牙电话SDK,并在其示例app的界面中展示DTMF字符的内容。使SIM卡电话通话时(来电或手机拨打出去)均可在界面中能正常查看到通话的目标手机按下的DTMF按键的字符内容。
2025-05-05 09:15:55
904
原创 手机打电话时电脑坐席同时收听对方说话并插入IVR预录声音片段
本文介绍了Windows电脑上运行的【蓝牙电话SDK示例app】的远程声音坐席的程序。用户可使用本程序,搭配上一篇章的【蓝牙电话SDK示例app】,实现通话过程中自动插播语音片段的能力,最终实现【通话过程中,电脑坐席一边收听对方声音,一边插播IVR预录的语音片段】的实现方案。
2025-04-25 17:02:45
1081
原创 手机打电话通话时如何向对方播放录制的IVR引导词声音
本篇章使用该方案的SDK示例app,仅仅通过为Android手机外置一个USB配件的情况下,拦截电话通话的事件和语音数据,进行数据识别和语音二次加工。实现手机app在电话通话过程中插播预先录制的开场白等语音片段的功能。
2025-04-25 00:08:51
1334
原创 Android应用app实现AI电话机器人接打电话
我们在手机厂商的AI通话的功能之外,拓展了一种不受手机厂商和定制安卓限制的方式,为社会上公共的开发人员提供了一种基于普通Android应用app级别的AI电话机器人的应用能力。上层app可以使用底层内置SDK,很容易的就可以对手机电话外呼和来电过程的通话声音进行提取和加工处理。上层app在这个基础之上可以自由的定制更多的电话的IVR语音导航和AI通话的相关功能,自由的接入DeepSeek等各种AI和大模型平台,为最终服务的用户,提供更加精细的个性化的能力。
2025-02-27 21:56:37
2619
3
原创 手机打电话时如何识别对方按下的DTMF按键的字符-安卓AI电话机器人
我们一般使用电话座机或手机,拨打电话时,在振铃阶段或接通后,均可以按下键盘上的数字0-9、*、#等按键,把对应的DTMF按键值发送给对方。通话的对方接收该按键值后进行业务处理和反馈。本篇章中,我们从DTMF频率的组成、FFT过滤声音的频率,以及DTMF字符的识别等角度,一起探讨一下:Android手机中,如何通过手机app,识别出通话时对方手机到底有没有按键、按的是哪个dtmf按键。
2025-02-27 09:06:23
1259
4
原创 ADB点击实战-做一个自动点广告播放领金币的脚本app
这个篇章中我们继续ADB连接专题,玩一下跟金钱相关的小游戏:做一个app去自动播放和结束广告来产生金钱收益,然后提现到微信或支付宝。使用Android手机自带的ADB的点击功能,按照预设的一定规律的脚本和场景识别,实现不停的自动点击/关闭广告、循环不停播放的供效果。
2025-02-12 17:26:19
2986
2
原创 蓝牙电话-做一个Android的SIP通话客户端
本篇章中,我们直接在【拨号器管理app】中集成SIP终端的功能,使得用户在另一个Android手机上能直接使用蓝牙电话的功能,通过SIP链路的方式桥接到蓝牙手机上,进行SIP呼叫来拨打目标电话(此方式不再依赖Windows电脑,但需要依赖另一个安卓手机)方案中继续采用上一篇章搭建的FreeSWITCH服务器做SIP链路的B2B-UA转发,通过局域网“云平台”,使另一台手机上的“软电话”能正常使用蓝牙电话的方案呼叫出去。
2025-02-12 09:47:52
1436
2
原创 手机app如何跳过无障碍权限实现弹框自动点击-ADB连接专题
我们在《ADB连接专题》系列文章中,对手机本身的ADB功能进行了一系列深入的挖掘,在本篇章中,我们着重的探讨了“手机app如何绕过无障碍权限实现弹框自动点击”的能力。实践发现,只要换个思路,世界的打开方式就完全不同,我们所有的操作和预期功能都能够有非常简洁清晰的途径去实现。
2025-01-25 16:29:34
1901
原创 如何跨互联网adb连接到远程手机-蓝牙电话集中维护
随便找一个手机,安装一个App并简单设置一下,就可以跨互联网的ADB连接到这个手机,从而远程操控这个手机做各种操作。你敢相信吗?而这正是本篇想要描述的内容。我们根据前面编写的ADB连接专题的两个篇章中阐述的内容,搭建了一个位于阿里云服务器的转发平台,将功能整合到了本系列主题的【智能拨号器App】当中。实现了随时用、随时开关ADB端口的能力。
2025-01-25 11:04:09
1917
2
原创 从零搭建一套远程手机的桌面操控和文件传输的小工具
本文主要阐述实现原理和事件的交互方式,讲述如何通过ADB中继线路的方式,实现外部阿里云的公网服务器某一个公开的TCP端口对应映射一台内网手机的ADB链路的连接办法。从而实现远程访问本地Android手机的ADB数据的操控方式。
2025-01-18 18:02:45
1531
2
原创 本地Android手机如何被远程访问和文件上传下载操作
本系列的篇章中,尝试将本地的手机,通过公开ADB连接的办法,将某个本地手机映射称为外部公网的一个TCP端口,在使用完毕后就关闭掉这个访问端口。通过这种模式实现灵活的远程访问和控制本地Android手机,进而实现常见的“远程控制手机打卡”、“获取Logcat调试日志”、“推送安装APP”、“文件push推送和文件pull下拉”等常规的Android手机的控制操作。这样,对于Android手机而言,ADB控制操作就能脱离了物理区域的限制,实现操作人员和目标实体手机在地理上分布和协同的工作方式。
2025-01-18 10:00:53
1033
原创 手机实时提取SIM卡打电话的信令声音-智能拨号器的SIP线路-双卡双待单通方案
从这一期的版本起,智能拨号器的手机app默认自动支持局域网双SIP坐席同时在线的能力。在呼叫和来电时手机app自动可以根据电话的呼叫方的手机号码,自动选择SIM1/SIM2的的手机卡进行外呼和来电的调度。真正的实现了局域网SIP坐席的双卡双待单通的电话呼叫方案。
2024-12-30 21:41:34
1358
原创 手机实时提取SIM卡打电话的信令声音-双卡手机来电如何获取哪一个卡的来电
在本篇章中,我们针对Android系统本身的双SIM卡的来电能力进行了一定的探索,实现了在代码逻辑层面中识别“双卡手机来电如何获取哪一个卡的来电”的数据。并在后续的功能逻辑中,根据不同SIM卡手机号来实现通话数据和业务调度到不同的局域网SIP坐席的功能。这样,对于手机app而言,就充分的利用上了手机本身自带的“双卡双待”的功能,降低了操作的复杂度,也减少了应用扩展的成本,为后续更加复杂的场景提供了理论和数据上的支撑。
2024-12-30 09:11:12
1124
原创 手机实时提取SIM卡打电话的信令声音--社会价值(二、方案特点和主要优势)
本篇章中我们主要论述我们当前的产品和方案,它到底有哪些特点?以及在各个细分领域中,相比对标市面上其它的方案,它的主要优势在哪些地方。同时结合具体实际的预设场景,剖析用户面临的实际痛点和难点,看看我们的产品和方案能够在哪些方面能够解决用户的实际需求,从而发挥出它更大的社会价值。
2024-12-11 21:36:35
1460
原创 手机实时提取SIM卡打电话的信令声音--社会价值(一、方案解决了什么问题)
这段时间,我们在技术范围之外陷入了一个自证或者说下定义的怪圈,即要怎么样去介绍或者描述:我们是一个什么样的产品。它在当前这个世界上,处于什么样的生态位?它解决了什么样的问题,能够适用在什么样的场景,都有哪些人可能会用它?在预期的领域里面,它的商业机会会有多大,即“假设所有条件都满足,你这个业务最多能做到多少个亿的规模?”。进而定义出“它有什么样的社会价值”。
2024-12-11 09:04:08
1168
原创 手机实时提取SIM卡打电话的信令声音-(题外、又插播一条淘宝选型的广告)
前几天我浏览拼多多和淘宝的时候,发现又面世了两款更加人性化的模具,此处贴出来供大家参考。我们基于市面上的最新的一些产品和配件(主要是京东淘宝拼多多经常做的推荐),按照正常的交互需要和审美需求,提炼和筛选出一些新的、较为经典的产品,顺便为它们做个宣传。
2024-11-30 20:07:45
840
原创 手机实时提取SIM卡打电话的信令声音-蓝牙电话如何适配eSIM卡的手机
现代社会新的设备和技术层出不穷,eSIM卡技术是近年来输出的一种与打电话业务有强关联性的一种探索,蓝牙电话方案理论上应该需要针对此类新型的科技和技术进行主动和及时的适配。目前看来,现有技术对遵循标准化方式的蓝牙电话方案没有太大影响,可以直接放心使用。
2024-11-30 17:56:11
1235
原创 手机实时提取SIM卡打电话的信令声音-(插播一条广告)蓝牙电话的Android版本-即将输出sdk
自蓝牙电话的方案输出以来,特别是基于Android手机的普通app+配件的方式来调用和提取手机外呼和通话的事件和声音的方案输出后,有很多使用和体验的用户和友商都在咨询,说这样的app方案,是否同步输出了对应的SDK。这样客户自己就能集成与整合到自己的app上,直接可以推送和应用到现有的客户上。开放SDK后,蓝牙电话的方案对客户自身的设备数量和用户均不再进行限制,客户可将整合后的SDK做为自有产权的功能,进行客户推广和下级代理与分销的推广。
2024-11-27 11:47:11
844
原创 手机实时提取SIM卡打电话的信令声音-智能拨号器的双SIM卡切换方案
智能拨号器app中,我们使用usb蓝牙与手机建立SLC蓝牙连接后,针对多SIM卡的场景,不再使用ATD10086;的方式进行外呼,而是直接采用app授权呼叫权限后,调用下述代码并传递SIM卡的卡号的方式进行指定SIM卡外呼。然后在呼叫过程中,使用建立好的蓝牙SLC连接,接收+CLCC等事件状态反馈,获知呼叫的目标号码、振铃状态、接通/挂断状态,并将其同步到局域网的SIP服务器中,转接到局域网的呼叫坐席上。通过以上方式,即可正常的实现SIM卡1和SIM卡2的对外呼叫。根本不需要设置什么默认呼叫卡。
2024-11-27 00:56:22
1862
原创 蓝牙电话-如何设置双SIM卡自动切换策略(设想)
手机双SIM卡自动切换的最终目的,就是允许手机根据呼叫频次和手机SIM卡预设的套餐分钟总数,结合当前(本月?)已外呼出去的通话分钟数,进行双SIM卡的自动切换策略。并将这个切换策略,允许用户自己进行脚本或功能的录制修改和重放,使用户名下所有的双卡手机,都能正常使用这个功能进行自动的业务逻辑切换。提高呼叫的接通率,减轻用户操作的复杂度。
2024-11-19 18:25:19
467
原创 蓝牙电话-如何自动切换手机SIM卡(预研方向)
本篇和后面篇章我们专门针对【Android手机双卡的SIM卡自动切换】这个课题,进行简单的预研,看看Android操作系统以及国内各大厂商的定制款安卓,有什么途径能做SIM卡双卡切换,并且比较通用的操作方式或方法。
2024-11-19 17:51:27
818
原创 蓝牙电话-无人值守的巡检方案探索
上一篇章我们分析到了探讨蓝牙电话方案无人值守和远程巡检这个方向的必要性并分析了蓝牙电话方案在无人值守方面会面临哪些问题。本篇章中,我们针对技术细节以及无人值守可能的实现方式,进行简单的探讨。目的是为了从通用一般的方法上,看看如果有类似的方案,它们做这个事情能走的通路大概都有哪些,以及如何要阻止这些方案和应用要这样去使用。
2024-11-11 17:40:11
1142
原创 蓝牙电话-如何做到无人值守(方案探讨)
本次篇章中,我们针对无人值守或者说远程巡检这个方向进行初步的探讨和设想,目的是为了规避后面蓝牙方案被应用在这样的非正常领域的场景。后面的篇章中,我们将会继续深入讨论看看为了应对这样的场景,我们能够做出哪些封锁和拦截的手段,避免出现设备链路或应用被应用在异地呼叫的场景,禁绝违法违规的业务使用。
2024-11-11 11:46:04
897
手机实时提取SIM卡打电话的信令和声音+最终解决方案+应用安装包+使用说明
2023-09-01
手机app进行AI打电话+总结+配套硬件+TypeC-USB转换器的电商产品下载链接参考
2024-01-03
(电脑-手机)蓝牙打电话+总结+配套硬件+USB蓝牙的电商产品下载链接参考
2024-01-03
手机实时提取SIM卡打电话的信令和声音+最终解决方案+调用的示例程序(Android)
2023-09-04
手机实时提取SIM卡打电话的信令和声音+最终解决方案+App功能说明书
2023-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人