【英语翻译随着信息化的快速发展,人们对于数据质量的要求越来越-查字典问答网
分类选择

来自李德彩的问题

  【英语翻译随着信息化的快速发展,人们对于数据质量的要求越来越高,数据清洗技术越来越成为人们关注和研究的焦点.如何从海量的股市资讯中快速、准确地挖掘出有用信息,是一个富有开发潜】

  英语翻译

  随着信息化的快速发展,人们对于数据质量的要求越来越高,数据清洗技术越来越成为人们关注和研究的焦点.

  如何从海量的股市资讯中快速、准确地挖掘出有用信息,是一个富有开发潜力的文本挖掘研究方向.目前的文本挖掘技术还难以快速、准确地识别信息中的错误或者不相关的“脏数据”.

  一般而言,低位买入同系机构投资者持股占流通股比例较高(且远大于其他十大流通股东占流通股的比例)的股票,是一种较易获得高收益的投资行为,故本文以在股市资讯中挖掘“十大流通股东同系机构投资者占流通股的比例”这一具有现实意义的问题为具体研究对象,来研究如何利用数据清洗技术来解决这些“脏数据”问题.

  本文结合在股市资讯中挖掘“十大流通股东同系机构投资者占流通股的比例”的应用实际,介绍了在股市资讯挖掘系统中数据清洗问题的研究背景,以及文本挖掘、数据清洗技术的国内外研究概况;概述了异常数据清洗相关知识,研究如何应用统计分析技术和人工智能方法来检测及清洗股市资讯挖掘系统中异常数据;进而在介绍重复记录清洗的意义、定义及基本流程的基础上,结合股市资讯挖掘的应用实际,分析研究了重复记录清洗流程中所涉及的算法,并提出了相关改进;最后从系统应用背景、源数据存在的问题,系统框架结构、实验过程与结果、系统评价与创新之处等方面介绍了以挖掘“十大流通股东同系机构投资者占流通股的比例”为主要功能的股市资讯挖掘系统.

1回答
2020-03-0914:01
我要回答
提示:回答问题需要登录哦!
戴节永

  Withthefastdevelopmentofinformationtechnology,thedataqualityreqestisincreasinglyhigher,datacleaningtechniquehasincreasinglybecomeafocusofconcernandresearch.

  Howfromthemassmarketinformationfast,accuratelyminetheusefulinformation,isarichpotentialfordevelopmentoftextminingresearchdirection.Thepresenttextminingtechnologyisalsodifficulttofast,accuratelyidentifytheinformationintheerrorornotrelatedtothe"dirtydata".

  Ingeneral,buylowhomologousinstitutionalinvestorsholdingsharesofahigherproportionof(andfargreaterthanthatoftheothertenshareholderssharesratio)stock,isarelativelyeasytoobtainhighyieldinvestmentbehaviorinthestockmarketinformation,sothisthesisdig"tenbigcirculationstockEastfellowinvestorssharestheproportionof"theproblemthathastherealisticmeaningforthespecificobjectofstudy,tostudyhowtousethedatacleaningtechniquetosolvetheproblemof"dirtydata".

  Accordingtomarketinformationinmining"thetenshareholdersofsyngeneicinstitutionalinvestorssharesproportion"ofthepracticalapplication,introducedinthestockmarketinformationminingsystemindatacleaningproblemsoftheresearchbackground,textmining,datacleaningtechniqueofthedomesticandforeignresearchgeneralsituation;anoverviewofdatacleaningrelatedknowledge,tostudyhowtoapplicationofstatisticalanalysisandartificialintelligencetechnologytodetectandcleaningmarketinformationminingsysteminabnormaldata;andthenintheduplicaterecordscleansingmeaning,definitionandbasicflowonthebasisofstockmarketinformation,combinedwiththeminingpractice,analysisoftheduplicaterecordscleansingprocessinvolvedinthealgorithm,andputforwardrelevantimprovement;finallyfromthesystemapplicationbackground,sourcedataproblems,systemframework,theexperimentalprocessandresults,evaluationsystemandinnovationetchavebeenintroducedtodig"thetenlargestshareholderincirculationfrominstitutionalinvestorssharesratio"asthemainfunctionofthestockmarketinformationminingsystem.

2020-03-09 14:06:20
大家都在问
最新问答