计算机搜索引擎实验项目,一种新型高效检索方法有你来创造!

2017-02-06 13:10 关注度:352

计算机搜索引擎实验项目,一种新型高效检索方法有你来创造!

方案特色

当今,大数据、云计算技术与平台快速发展,海量的信息和工具开始在云平台上得以部署,如何快速的检索用户关心的信息和工具,成为学术界研究的热点话题和产业界应用的急迫需求。


本项目授课和实验内容属于计算机科学与技术学科下信息检索的范畴,在学习过程中会渗透很多信息检索的历史、模型、思想、实现和应用,具体以构建最终的实验“一种新的海量流程模型高效检索方法的设计与实现”为目标,展开相关领域知识的讲解、讨论、设计及实现。

适合人群

对计算机感兴趣的高中生

活动内容

Day 1

信息检索相关知识介绍、Petri网、Java编程基础

业务流程模型表示语言——Petri网及其建模、分析工具PIPE

Java编程语言、递归函数设计、UI设计及相关集成开发环境Intellij IDEA

·实验1:给定自然语言描述的业务流程,用PIPE工具进行Petri网建模并进行可达图分析


Day 2

企业业务流程展示、重要性介绍、应用场景阐述

信息检索模型介绍:布尔模型

基于BeehiveZ类库、jBPT类库的Petri网导入、遍历和输出

·实验2:基于BeehiveZ或jBPT编写程序,实现Project1中所建流程模型的循环结构查找及对每个节点按照深度进行编号的算法


Day 3

基于行为语义的流程模型相似性(Trace、CFS、TAR、BP、BP+)

基于BP+算法,介绍流程模型特征提取算法设计及其在BeehiveZ、jBPT工具中的实现

·实验3:基于BeehiveZ或jBPT编写程序,实现Project1中所建流程模型的TAR特征提取,并将对应特征输出到控制台


Day 4

信息检索机理介绍:倒排文档、查询与索引

流程模型的结构特征统计及流程模型索引设计的考虑

全文检索引擎工具包Lucene与BeehiveZ的集成

·实验4:基于jBPT编写程序,实现已有的BP+相似性算法的对应索引在BeehiveZ中的设计、实现与集成


Day 5

BeehiveZ中流程模型自动抓取程序、自动生成程序的实现机理

BeehiveZ中基于关键词、查询语言和样例的流程模型检索机制介绍

实习收尾总结及开放问题讨论

·实验5:基于jBPT编写程序,实现基于已有的BP+索引的基于样例的流程模型高效检索,并给出最终的测试模型库规模、测试环境及测试结果

活动收获

实践内容丰富,掌握系统专业知识,熟悉核心计算机操作技能

获得实验报告与实习证明,表现优异的学生可获得官方推荐信

常见问题

项目日期:2017年1月22日-26日(5天实地实习) 2月1日-15日(2周远程实习)

注:远程实习是指导师利用邮件、QQ等指导学生完成实验任务,每周导师与学生沟通1-2次

项目地点:北京


有问必答,专业学习规划师为您免费咨询解答
课程底价、品牌对比、师资力量、学习时间、课程内容、报考政策...想了解什么?就来咨询学习规划师吧!