• <object id="wmooc"><u id="wmooc"></u></object>
  • 首页> 外文学位 >文献详情
    【6h】

    Facilitating internet-scale code retrieval.

    机译:促进互联网规模的代码检索。

    获取原文
    获取原文并翻译 | 示例
    ¥30

    摘要

    Internet-Scale code retrieval deals with the representation, storage, and access of relevant source code from a large amount of source code available on the Internet. Internet-Scale code retrieval systems support common emerging practices among software developers related to finding and reusing source code. In this dissertation we focus on some system and domain-specific challenges of Internet-Scale code retrieval.;This dissertation starts with an in-depth study of how developers use Koders, a commercial code search engine. The results of this study highlight several problems that need to be tackled in a commercial code search engine. To build solutions for some of these problems we develop an infrastructure, Sourcerer, that includes models and tools for large-scale collection and analysis of open source code. The stored contents and set of programmable services in Sourcerer enable rapid development and evaluation of retrieval schemes and applications of code search. We demonstrate the feasibility of developing state-of-the-art Internet-Scale code retrieval techniques on top of Sourcerer by presenting the implementation and evaluation details of code-specific retrieval schemes and code search tools.;The central premise of this dissertation is that source code retrieval techniques that incorporate structural information extracted from source code can be more effective in retrieving relevant code entities. We support this premise by presenting three approaches that lever-age structural information in code search. First, we present structure-based techniques to improve ranking in retrieving implementations of commonly sought for programming features, where our best technique outperforms Google and Google Code Search. Second, we present Test-Driven Code Search (TDCS), an approach to finding reusable code fragments on the Internet, that uses structure-based code retrieval and dependency slicing -- a technique to automatically pull code dependencies. Evaluation of TDCS with 34 students shows that TDCS is the fastest approach to find reusable code fragments for 59% of the students, and faster than Google Code Search for 66% of the students. Finally, we present Structural Semantic Indexing, a technique to associate meaningful terms with source code entities that improves the performance of retrieving code fragments to be used as API usage examples.
    机译:Internet规模的代码检索处理来自Internet上大量可用源代码的相关源代码的表示,存储和访问。 Internet规模的代码检索系统支持软件开发人员中与查找和重用源代码有关的常见新兴实践。本文主要研究Internet规模代码检索的一些系统和特定领域的挑战。本文从对开发人员如何使用商业代码搜索引擎Koders的深入研究开始。这项研究的结果突出了商业代码搜索引擎中需要解决的几个问题。为了构建针对其中一些问题的解决方案,我们开发了Sourcerer基础结构,其中包括用于大规模收集和分析开放源代码的模型和工具。 Sourcerer中存储的内容和可编程服务集可以快速开发和评估检索方案以及代码搜索的应用程序。通过介绍特定于代码的检索方案和代码搜索工具的实现和评估细节,我们证明了在Sourcerer上开发最先进的Internet规模代码检索技术的可行性。;本论文的中心前提是:包含从源代码中提取的结构信息的源代码检索技术可以更有效地检索相关代码实体。我们通过提出三种在代码搜索中利用结构信息的方法来支持这一前提。首先,我们提出了基于结构的技术,以提高检索常用的编程功能实现时的排名,而我们的最佳技术要优于Google和Google Code Search。其次,我们介绍测试驱动代码搜索(TDCS),这是一种在Internet上查找可重用代码片段的方法,它使用基于结构的代码检索和依赖关系切片(一种自动提取代码依赖关系的技术)。对34名学生的TDCS进行的评估表明,TDCS是找到59%的学生可重复使用的代码片段的最快方法,并且比Google Code Search的66%的学生更快。最后,我们介绍了“结构语义索引”,这是一种将有意义的术语与源代码实体相关联的技术,可提高检索用作API使用示例的代码片段的性能。

    著录项

    • 作者单位

      University of California, Irvine.;

    • 授予单位 University of California, Irvine.;
    • 学科 Information Science.;Computer Science.
    • 学位 Ph.D.
    • 年度 2010
    • 页码 256 p.
    • 总页数 256
    • 原文格式 PDF
    • 正文语种 eng
    • 中图分类 ;
    • 原文服务方 国家工程技术数字图书馆
    • 关键词

      ;

    相似文献

    • 外文文献
    站内服务

    联系方式:18141920177 (微信同号)

    客服邮箱:kefu@zhangqiaokeyan.com

    京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司?版权所有
    • 客服微信

    • 服务号

    婷婷五月亚洲综合图区_五十路A片熟妇在线观看_国产成人免费资源在线播放_欧美成人熟妇激情视频