分享
结构主义建模-北京工业大学孟大志.ppt
下载文档

ID:3459820

大小:1.10MB

页数:56页

格式:PPT

时间:2024-05-08

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
结构主义 建模 北京工业大学 大志
结构主义数学建模方法,孟大志北京工业大学Tel:(010)69755596 13701377108,目录,一、引子:建模=引模?二、模型、数学与数学建模三、结构化数学建模方法四、结构化建模例子五、结构主义数学建模理论六、数学建模研究,一、引子:建模=引模?,大学生的问题:数学建模=数学引模?,一个数学建模培训教学流程:介绍建模五步法(一节课);工具训练(四节课);讲解案例(二十节课);练习(十节课),分析实际问题的系统方法?建模的一般方法?,实际或竞赛的建模问题,课程学习与培训中的数学建模案例,类比、引用和借鉴是很有效的方法。,数学建模方法=创造性的本质方法+模型类比方法。,但不是唯一的:,Web中的例子,网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体文件在传输(例如,路透社每天收到网上文本文件达20万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。,数学建模本质上是一个创造性的过程!数学建模不仅是为了竞赛,更是为了数学应用与研究!新问题不一定有借鉴的先例!,没有可引用、借鉴的案例时怎么建模?,E.A.Bender的数学模型定义:数学模型是关于以部分现实世界为一定目标而作的抽象、简化的数学结构。,抽象什么?如何抽象?,什么是抽象:最抽象!,结构化数学建模方法:基于创造的本质性方法。,问题:如何从数学模型的基本概念出发构造方法?,思路:模型?+数学?=数学模型?,1)社会科学模型经济与管理科学模型、军事模型(越战)、政治模型、社会学模型等等。,1、什么是模型,这是一个通过举例或指认回答的简单问题。,二、模型、数学与数学建模,例经济学模型:市场模型、竞争模型、企业战略模型、股票模型、金融模型,等等。,建筑模型,交通模型,电路模型,服装模型 等等。表达:建筑设计图、交通网络、电路图、服装模版等。,2)工程技术模型,各个领域或专业有自己的“模型”,称”专业模型”。共同特点:用专业理论分析,抽象出的结构,并用专业语言表示,比较直观,易于理解。,5)物理模型基本粒子、原子模型、晶体模型、光学的衍射等等。,4)化学模型苯环、化学健理论、反应平衡等等;,2、模型是什么?从例子的共性抽象出的概念:,模型:以特定目的对事物原型抽象出结构并适当表示。,抽象出结构:不是一般概念的抽象,而是结 构的抽象;,适当的表示:使用不同知识与方法,需要不同 的语言表示。,特定目的:目的不同,关注的结构(事物的内部联系)不同;,例.目标不同,模型不同飞机模型,目的:空气动力学研究抽象结构:外型结构,除去内部构造;,目的:机舱设计抽象结构:内部空间结构,除去外部结构;,不同目的关注的内容不同,抽象的结构不同。,表示:专业图形和航空语言表示。,例.地图结构的抽象,概念的抽象(不是模型!):楼群、居住小区、公共场所与设施、商区、政府机关、河流、湖泊、公交线路、各级公路、快速路、高速路、立交桥等等。,目的:城市交通研究,抽象出结构:小区、商区、立交桥、道路、交叉路口等概念的关联和区分忽略细部特征、概念的部分内涵、人口结构等等。,模型表示:城市交通地图(成都),3、核心是结构,什么是结构?,例 图书馆的藏书结构,字符集:中文字、英文字母、数字等等各种字符的全体。字符串的集合。,书、文章、多媒体文本等形成子集族集合的文本结构。,文本按知识类型分类,形成不同层次的子集族国际图书分类法图书馆的藏书结构专业模型。,结构是核心:相同元素的集合,不同结构原型的意义不同。,例 语言,下雨天 留客天 留我不留,下雨天留客 天留我不留,语言的结构不同,含义不同(数据同)。,插入一个给大家解烦、解困的例子!,例.语言的不同结构产生不同的文学信息,唐诗清明时节雨纷纷路上行人欲断魂借问酒家何处有牧童遥指杏花村,宋词清明时节雨纷纷路上行人欲断魂借问酒家何处有牧童遥指杏花村,清明时节雨纷纷路上行人(欲断魂):借问酒家何处有?牧童(遥指):杏花村。,时间环境地点人物语言另人物动作语言,元曲(剧本),抽象出结构:,七言唐诗,比较规整,适于言志“诗言志”,宋词,错落有序,用语活跃,适于抒情“词抒情”,元曲时间、地点、情景、人物、动作、言语等。用语白话,易懂。,百姓故事,模型:分析原型的结构,抽象并表示结构,结构是核心!,结构主义学派(Bourbaki):数学=集合+结构,4、数学与普适性,1)、数学是什么?,这是一个没有统一答案的问题。,2)、数学的普适性,数学研究的内容决定了数学的普适性:数学是研究结构的,因此数学是普适的!,3)模型的抽象度差别,科学的依赖序关系与抽象度,这种单调的依赖关系由科学领域的物质组成决定。,每门学科都有各自的模型,抽象度也是依次降低。,抽象度低的模型易于表达;抽象度高的模型有普遍性并能使用有力的抽象分析工具;数学模型是抽象度最高的模型,因此有普适性。,三、结构化数学建模概念,模型原型结构的适当表示;数学:集合+结构,数学是研究结构的;数学模型:原型结构的数学表示。如何建模?把两个表示联系起来同构方法。,3)推导模型公式 完善模型的假设,并表示成适定的形式。,4)求解模型,5)回答问题,2)选择建模方法 利用经验、技巧和文献选择解决问题的一般性求解方法。,1)提出问题,一般建模程序,Mark M.Meerschaert的著作“Mathematical Modeling”中,提出数学建模的五步法,1、五步法,以上方法并没有解决抽象什么、怎么抽象,学生在没有经验的条件下往往束手无策。,通常的教学重点在于讲案例,学生没有本质的建模方法的情况下,于是“荐模”和“引模”成为主要方法。,结构化建模方法不是排斥“五步法”,而是充实“第二、三步”的具体可行的方法。,结构化建模基于结构主义,结构化建模即是思想也是方法:一切原型都有结构,模型=抽象出原型结构的适当表示;数学=集合+结构;数学模型=原型结构的数学表示;数学建模=分析原型的结构,建立与数学结构的对应(同构)并用数学语言表示。,2、结构化建模方法,3、结构化数学建模程序,数学语言表示的结构,数学模型,专业语言描述结构,专业模型,分析出原型的结构,并用数学语言表示的模型。,一般流程:,有些问题专业模型难,有些问题数学模型难。,对原型确定目的,Web中的数学建模例子,网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体文件在传输(例如,路透社每天收到网上文本文件达20万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。,四、结构化建模例子,在线文本自动分析建模,原型的目标:在线电子文本的计算机自动分类与辅助理解。理解基于分类,分类是理解的前提。,不同的分类目的有不同的分类模型:,理解性分类 基于语意、概念层、主题层的细分类,目的是分析和理解。,、建立专业模型,检索性分类 国际图书分类法,目的是查询;,原型的结构分析,文本章节节段落语意团句或短语词字符,文本的结构:,原型有两层结构:文本的结构;文本集合的结构。,分析:文本集合的结构是原型对应目的的主要结构;文本集合的结构依赖于文本的结构(子结构);文本结构的表示应该利于文本集合分类目的。,文本集的结构分析:,联想到数学中代数结构:集合中定义代数运算,加法和数乘,元素间的运算关系 结构相同!,两个文本的合并还是文本一个文本的倍数仍然是文本,分析文本集的结构,首先是文本之间的相互关系:,、同构分析(数学结构与原型结构的联系),同构:此时问题的原型的结构直接和数学结构联系起来!,文本的集合应该有一个“线性空间”的结构;文本的分类是在线性空间中的“向量的分类”!,对于线性代数的结构有清楚的理解和关注,则容易发现:,因此,每个文本对应地定义一个文本向量,用于分类,分量如何定义?,显然,分量是“分类特征”的具体表示:从关键词和检索中,容易想到基于词频的,可用于区分文本的量化的表示!,数学模型:向量空间的结构+词频特征表示。,、同构表示与数学建模,建立原型结构的数学表示则建立了数学模型。,文本集合同构于线性空间,文本的分类是线性空间中向量的分类。,根据专业知识,词频及具有分类的特征信息,信息熵!因此可以仿照熵的定义:,这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念;二来,词频的作用大于词在文本集合中出现的作用。,假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i)是指在D中至少出现一次w(i)的文本数。则每一个文本djD,和一个特征词w(i)存在一量:,形式化:,记d(i)j=TFIDF(w(i),dj),则每一个文本djD,存在一个分量适当排序的文本向量。,文本向量空间模型与文本向量:,问题的目标:文本集的分类,建模过程,文本自动分类:理解文本的类属性,子空间分类.文本自动聚类:发现文本集合中的新模式,新概念.,文本向量:由文本的实意词的特征值或特征模式为分量的向量.以信息熵的形式构造.,特征子空间:具有某种共同意义的分量组成的子空间.,文本向量空间:全部文本向量的高维线性空间.,应用事例:思想史研究中,“五四”运动的讨论的主要思想是什么?,发现在“自由主义”的特征词所在的子空间中,文本的投影数量最大!,高维问题;训练集的数据量大;理解性细分类的精度低。,主要数学问题和某些进一步研究课题:,1、词频分布特征的研究,用分布特征分类和理解;,2、添加语意的分类模型;,3、大规模数据挖掘方法寻找分类模式与规则。,例题小结:本题在向学生展示时,几乎没有人有任何思路,主要是未见过类似的问题。这是因为“引模”成为习惯的思路。,如果有结构化建模的理念,而且熟悉线性代数,就比较容易通过一定的思考产生模型的。,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开