北卡罗来纳州立大学研究人员开发的软件可以在几秒钟内而不是几周内修复“挂起错误”

发布日期:

罗利 — 挂起错误(当软件卡住但没有崩溃时)可能会让用户和程序员感到沮丧,公司需要数周时间才能识别和修复。

现在,北卡罗来纳州立大学的研究人员开发出了可以在几秒钟内发现并解决问题的软件。

“我们中的许多人都有过挂起错误的经历 - 想想当你在网站上时,轮子一直在旋转,”该研究论文的合著者、北卡罗来纳州计算机科学教授 Helen Gu 说。状态。 “因为这些错误不会导致程序崩溃,所以很难检测到。但它们可能会挫败或赶走客户,并损害公司的利润。”

考虑到这一点,Gu 和她的合作者开发了一个名为 HangFix 的自动化程序,它可以检测挂起错误,诊断相关问题,并应用补丁来纠正错误的根本原因。顾讨论该计划的视频可以在这里找到。

研究人员针对 10 个常用云服务器应用程序中的 42 个实际挂起错误对 HangFix 原型进行了测试。这些错误是从程序员发现的影响各个网站的挂起错误数据库中提取的。 HangFix 在几秒钟内修复了 40 个错误。

“剩下的两个错误已被识别并部分修复,但需要具有应用程序相关领域知识的程序员提供额外的输入,”顾说。

相比之下,首次发现这些挂起错误时需要花费数周或数月的时间来检测、诊断和修复这些挂起错误。

“我们乐观地认为,这个工具将减少挂起错误的发生,并且网站不会让许多用户感到沮丧,”Gu 说。 “我们正在努力将 Hangfix 集成到 InsightFinder 中。” InsightFinder 是由 Gu 创立的基于人工智能的 IT 运营和分析初创公司。

论文“HangFix:自动修复生产云系统的软件挂起错误”将在 10 月 19 日至 21 日在线举行的 ACM 云计算研讨会 (SoCC'20) 上发表。该论文由何静珠博士共同撰写。北卡罗来纳州立大学即将毕业的学生;戴婷,博士北卡罗来纳州立大学毕业生,现就职于 IBM 研究中心;以及北卡罗来纳州立大学计算机科学助理教授金国良。

这项工作是在国家科学基金会拨款 1513942 和 1149445 的支持下完成的。

HangFix 是 Gu 团队为解决云计算挑战而开发的一系列工具中的最新产品。她的 2011 年论文“CloudScale:多租户云系统的弹性资源扩展”在今年的会议上被选为 2020 SoCC 10 年奖的获得者。

(c) 北卡罗来纳州立大学新闻

原文来源: WRAL 技术线