MCM2016C题研读

2016C论文研读

题目描述

慈善组织Goodgrant基金是一家致力于帮助大学生在美国大学提高教学表现的机构。现在,这个机构想要从2016年7月起持续五年给学校的某个合适的组织捐赠总计1亿美元/年的资金。但他们不想复制诸如盖茨基金会等大型资助组织的投资模式和焦点。

要求你的队伍来设计一个模型,确定最优的投资策略包括(区分)学校、每个学校投资金额、投资回报和对学生表现最可能产生较大影响的资金提供的时间长度。策略应该包含一份1-N最优化和优先处理的候选学校名单,这份名单是你基于每个学校阐述(表现)的资金有效利用潜能和一份用恰当方式做出的投资回报估计。

附件里的数据文件夹可以对你有所帮助。它含有从美国国家教育统计中心(该中心维护着一个包括全美高等教育调查信息的扩展数据库)和学院记分卡数据网站(该网站有很多长期的教育表现数据)提取的信息。你的模型和后续的策略必须基于这两个数据集中有意义的、可信的部分。

优秀论文总结

论文一50193清华

近年来,大数据日益普及,包括慈善领域在内的很多领域都需要大数据的引导。本文利用数据挖掘方法对数据进行处理,构建了一种新的慈善组织投资回报率评价体系,并成功地确定了古德格兰特基金会的最优投资策略。

首先,我们对数据进行操作。根据信息的完整性和冗余性进行数据筛选,删除信息量小于阈值的数据,并利用线性拟合和主成分分析对不同属性进行合并。对于保留的属性和学校,我们基于K-均值聚类对缺失的数据进行数据填补。然后,我们对所有数据进行归一化处理,以使它们在下面的分析中具有可比性。

其次,我们构造了ROI评价标准,即投入产出比乘以调整系数,称为“紧迫度”。这一比率反映的是与成本相关的效益,而紧迫性反映的是对资金的需求,这是慈善组织应该考虑的一个重要因素。我们使用主成分分析来选择属性,用工资、教育质量等来表示产出,用学费来表示投入,用联邦贷款、债务等来表示紧迫性。

然后,运用层次分析法对不同因素之间的重要性进行度量和权重分配。第三,提出了两种模型,一年的基本模型和五年的时间序列模型。将投资回报率视为投资收益,将产出波动视为“风险”,仿照现代金融领域的投资组合理论来解决这一问题。在基本模型中,我们开发了一种混合整数线性规划算法,并成功地找到了14个学校进行投资。在此基础上,考虑了时间因素,将模型改进为时间序列模型,利用MILP和灰色预测来确定长期投资策略。16所学校被选为不同持续时间和不同金额的学校。

最后,对模型进行敏感性分析,改变学校数量、资金约束、资金分配是否均等等,分析不同的产出结果,找出理想结果的较好参数

综上所述,我们的模型是一个可行的、合理的、有技术和数据支持的模型。由于该模型具有主观性,经过数据训练后可以灵活使用。

(To sum up, our model is a feasible and reasonable model with technical and data support. Because of the subjectivity, this model can be used flexibly after data training.)

用到的算法有: AHP, PCA, K-means clustering, MILP, Grey Theory和其他金融理论,方法较全面且易学。

论文二47823上财

我们将开发一个教育模型,以确定一个最优的教育投资战略,以进一步提高在美国留学的本科生的整体表现水平。我们的投资模型包括三个部分:

在第一部分,我们可以收集关于其他基金会投资的主要焦点的数据,这些数据是按不同主体和地点划分的。(注1)我们的投资模型包括三个部分:第一部分是第一部分,我们可以收集关于其他基金会的投资重点的数据,这些数据是按不同主体和地点分类的。我们也可以考虑让他们成为Goodgrat基金会的第一个慈善机构身份认证机构。然后,我们可以制定计划来决定我们的重点,也就是说,我们应该把更多的资金投入到那些拥有更多少数族裔学生比赛、更低的教育成绩、更高的债务负债率等的主要学校上,这些学校应该更多地投资于那些拥有更多少数族裔学生比赛的学校,以及更低的教育成绩和更高的债务负债率等等。在这一部分中,我们还可以将这些数据数据分成两组,一组用于学校选择,另一组用于确定ROI。

在第二部分中,作为一种有效的数据提取方法,我们可以建立一个高效的、直观的评估模型,根据我们的评估重点的相关性原则,而不是使用传统的PCA评估方法,来对学校的最佳候选学校进行排名,这是一种非常有效的方法,也是一种直观的评估模型,可以根据我们的评估重点的评估相关性原则,使用最优的PCA评估方法来对学校的候选学校进行排序。在此之后,前50名的学校也被评选为我们的主要目标学校。

在第三部分中,我们要做一个关键的假设:一所普通学校的社会公用事业收入与毕业生的平均收入水平和平均毕业率呈对数关系。此外,我们还可以创建一个新的参数k来表示上述两个主要因素之间的最小边际替代率(MRS)。在那之后,我们就可以来把每个目标学校的净资产收益率(ROI)函数集定义为最大的增量收益效用。

我们还需要进一步讨论如何用几种可行的方法来制定最好的投资战略。最后,我们可以选择基于扩展的拉格朗日函数的改进的粒子群优化算法。该算法是一种较典型的求解带约束条件的多变量数学优化问题的方法。然后,我们可以通过计算五年来最大的累计投资回报率,为他们提供一份最新的推荐名单。更重要的是,我们的模型模型是足够广泛的,可以很好地容纳任何复杂的非线性模型约束和优化问题。

最后,我们可以改变参数K的数值取值范围,以更好地检验我们未来投资策略的最大敏感度范围。在此基础上,我们可以改变参数K的数值取值范围,以更好地检验我们未来投资策略的敏感度。这一结果也表明,我们的商业模式是健壮的

论文三42939清华

为了确定最优的捐赠策略,提出了一种适合慈善组织的数据激励模型,该模型基于原始的投资回报率(ROI)定义。

首先,在解决缺失数据之后,我们开发了一个被称为成绩指数的综合指数来量化学生的教育表现。绩效指标是毕业率、毕业生收入等几个常用绩效指标的线性组合。并通过主成分分析确定了它们的权重。

接下来,为了处理高维数据带来的问题,我们采用线性模型和一种称为后套索的选择方法来选择在统计上对绩效指标有显著影响的变量,并确定它们的影响(系数)。我们称它们为性能贡献变量。在本例中,选择了5个变量。其中,2010年学杂费和卡内基高研究活动分类不受捐款金额的影响。因此,我们只考虑获得佩尔助学金的学生的百分比、兼职学生的比例和学生与教师的比例。

we employ a linear model and a selection method called post-LASSO to select variables that statistically significantly affect the performance index and determine their effects

然后,采用广义自适应模型估计这三个变量与捐赠量之间的关系。我们对跨部门的关系进行拟合,并从捐赠金额到绩效贡献变量的值获得拟合函数。然后,我们将捐赠的影响分为两部分:均值和异质。均质影响建模为性能贡献变量的拟合值随捐赠金额的增加而变化,这可以从拟合曲线中预测。异质模型被建模为调整参数,该调整参数基于与拟合曲线的偏差来调整同质影响。他们的产品是实际绩效价值的增长,而不是捐赠数量的增长。

Then, a generalized adaptive model is adopted to estimate the relation between these 3 variables and donation amount. We fit the relation across all institutions and get a fitted function from donation amount to values of performance contributing variables. Then we divide the impact of donation amount into 2parts: homogenous and heterogenous one. The homogenous influence is modeled as the change in fitted values of performance contributing variables over increase in donation amount,which can be predicted from the fitted curve. The heterogenous one is modeled as
a tuning parameter which adjusts the homogenous influence based on deviation from the fitted curve. And their product is increase in true values of performance over increase in donation amount.

最后,我们计算投资回报率,定义为绩效指标的增长超过捐赠额的增长。该投资回报率是特定于机构的,并取决于捐款额的增加。通过采用两步ROI最大化算法,我们确定了最佳投资策略。

此外,我们提出了一个扩展模型来处理由于捐赠的持续时间和地理分布所引起的问题。

论文四52815

我们提出了一种贝叶斯多阶段模型,以在未来五年内最大化投资回报率(RI)。

首先,建立了一个模型,将一所学校的学生专业分布与该学校将为经济增加的预期工作数量相关联。在这里,我们将每个特定学科的失业前景与该专业的学生百分比相关联每所学校都选择该特定课程。如果一所学校要在已经过饱和(即失业率高)的领域中培养大量的毕业生,那么它实际上被分配给经济中的工作数量。

接下来,建立模型以给出增加经济的就业机会与实际国内生产总值(GDP)变化之间的关系。该模型基于我们观察到的logGDP变化与失业率变化之间的线性关系,适合于最初收集的数据。于1948年问世。考虑到该领域,这种特殊的模型非常适合。

根据增加的GDP和其校友的中位数薪水,每所学校都被授予善良等级。

工资只是按比例缩放并添加到GDP中以计算该指标。

我们建议的核心是一个线性回归模型,将善良与学校学费和入学人数相结合,该模型旨在包含有关学校资源如何影响其善良的一般信息。

此整体模型的后代用作一系列模型参数的先验(这些先验具有额外的方差,以免压倒数据),每个都适合特定学校。每个模型都代表一个预测学校每名学生的可用资金与其善良之间的关系,以及其资金的变化将如何影响其善良,我们称之为善良曲线。

我们将对学校的金钱投资建模为增加该学校的“有效学费”,这将根据其学校的良善曲线来增加该学校的良善。这种良善的变化是我们衡量Rol的建议。

给定Rol的定义,我们面临的问题是应在哪里支付投资,以使Rol的总和最大化:我们解决了一个简单的优化问题,以获得建议的结果。

这些曲线是根据对美国GDP变化和人口增长的计量经济学预测,从2016年到2020年每年计算的。

我们模型的每个阶段都是简单的,并且模型的整体是复杂的而不是复杂的。这导致了一个模型,尽管它很简单,但很容易解释。

根据我们的分析,我们目前列出73所学校,其中包括普林斯顿大学,哈佛大学和麻省理工学院等知名学校,以及其他一些知名度较低的学校,这些学校有望成为投资的重要目标。我们还介绍了我们认为供资最有效的时间段。

用R和Python中执行数据操作。BUGS用于模型参数的贝叶斯推断,R用于解决伴随的优化问题。

结论

数据预处理很重要,也很考验水平和经验,需要对属性筛选、删除、合并和归一化处理等

构建评价指标和体系,需要针对背景中的主体,不能凭自己打分和量化,一定是基于相关文献

有时间因素时,可以改进为时序模型,再预测

最后灵敏度分析,防止过拟合,验证鲁棒性

各步骤具体使用什么算法,最好有相关文献支撑


   转载规则


《MCM2016C题研读》 帅张 采用 知识共享署名 4.0 国际许可协议 进行许可。
  目录