COMP2271 DATA SCIENCE 2022Python

Java Python COMP2271-WE01

DATA SCIENCE

2022

Section A Probability

Question 1

(a)  The 26 letters of the alphabet (a,b,. . . ,z) are arranged in random order to produce a string S of length 26 (each permutation is equally likely).

i.  Let A denote the event that S contains the word “durham” .  Calculate the probability P(A). [3 Marks]

ii.  Let B  denote the event that S contains the word  “end” .  Calculate the probability P(B). [2  Marks]

iii.  Calculate the conditional probability P(B | A). [3  Marks]

iv.  Are the events A and B independent? Justify your answer. [2 Marks]

(b)  Log-ins at a server S1  can be modelled as a Poisson process with an arrival rate of 12 log-ins in 24 hours.

i.  Let  A be the event that on a particular day there will be no log-in during 1pm-2pm. Calculate P(A). [2  Marks]

ii.  Let B  be the event that on a particular day there will be two log-ins during 2pm–4pm. Calculate P(B). [2 Marks]

Another server S2  has 20 regular users.  Each of those users logs in exactly once on each day, at a time between 0:00 and 23:59.59 chosen uniformly at random, and nobody else uses the server S2 .

iii.  Let C be the event that on a particular day there will be exactly two log-ins during 2pm–3pm on this server S2 .   Calculate  P(C). [3 Marks]

iv.  Let X  be a random variable that denotes the number of log-ins dur- ing 2pm–3pm on sever S2 .  Calculate the expectation, variance and standard deviation of X . [3 Marks]

(c)  The joint density function of two continuous random variables X and Y is given by

i.  Determine the value of c. [2  Marks]

ii.  Determine the marginal densities fX  of X and fY  of Y. [4 Marks]

Note: If you need to refer to a Z-table to answer the following questions, you can find one on the following pages.

(d)  The annual salaries of data scientists in the UK follow a normal distribution with standard deviation σ = 15,000.  We choose a simple random sample of n data scientists and record their annual salaries.

i.  Describe  how  to determine a two-sided confidence interval  [a,b] so that, with 99% confidence, the true mean of the annual salaries of data scientists in the UK lies in the interval. [4  Marks]

ii.  How  large does the sample size n need to be at least if we want the confidence interval (with 99% confidence as in (i)) to have length at most ε5,000. [4  Marks]

iii.  We choose a sample size of n  = 50,  and the  mean of the salaries in the sample is ε52,000.  Determine a one-sided confidence interval I = (−∞, b] that, with 99% confidence, contains the true mean of the annual salaries of data scientists in the UK. [3 Marks]

(e)  It is commonly accepted that  10% of the users of a social media platform believe in conspiracy theories.  We susp COMP2271 DATA SCIENCE 2022Python ect that the proportion is actually higher.  To investigate this further, we carry out a hypothesis test.  We interview  100  randomly selected  users and  record whether each of them believes in conspiracy theories or not. We find that 15 of the 100 users in the sample believe in conspiracy theories.

i.  Formulate  a  suitable  null  hypothesis  and  a  suitable  alternative  hy- pothesis. [2 Marks]

ii.  Is the test a two-tailed, left-tailed or right-tailed test? [1  Marks] iii. What is the value of the test-statistic z that we should calculate from the sample data? [2 Marks]

iv.  What is the resulting p-value? [2  Marks]

v.  If we choose a significance level of 0.01, how should we formulate the outcome of this hypothesis test? [2  Marks]

vi.  Assume that the true proportion of users who believe conspiracy the- ories is 20%. What is the probability β of a Type II error for our test procedure? [4 Marks]

Section B Computer Graphics

Question 2

This question relates to rendering the steam train model as shown in Figure 1.

Figure 1: Steam train model.

(a)  Assume that when the train translates, its wheels also rotate.  Draw a scene graph for the train model, with the aim of simplifying the graph hierarchy. Marks will be given based on:

i.  Correct structure and organisation of model parts. [8  Marks]

ii.  Correct transformation operations involved. [6  Marks]

(b) Assume that drawbox() and drawcircle() are given functions for you to render a box and a circle with normalised dimensions, respectively.  Write a WebGL code segment based on the scene graph in (a).  Marks will be given based on:

i.  Correct overall program structure. [5  Marks]

ii.  Correct usage of WebGL statements to model train parts and support train motion. [9 Marks]

(c)  Suppose you  have  put 10000 steam train models spreading around a 3D virtual environment for rendering through scan-conversion. When visualis- ing the virtual environment, a user is expected to see some trains moving closely to the  user while other trains  may  be far  away from the  user or temporarily out of the user’s sight.

i.  Which component of the scan-conversion rendering pipeline contributes the most in supporting interactive rendering of the virtual environ-ment? Justify your answer. [5  Marks]

ii.  Analyse why it may still be difficult to render the virtual environment interactively in practice. Suggest a solution  by modifying  the  im-plementation of the virtual environment to significantly improve its rendering speed. [7 Marks]

(d)  To enhance rendering quality of the virtual environment in (c), both direc- tional lighting and normal mapping are applied.

i.  Suggest which shader is suitable for implementing directional lighting. Justify your answer. [4  Marks]

ii.  Analyse  if applying directional  lighting  is sufficient to support  nor- mal mapping.   If yes, justify your answer.   Otherwise, suggest with explanation whether any extra lighting(s) is/are required         

考虑柔性负荷的综合能源系统低碳经济优化调度【考虑碳交易机制】(Matlab代码实现)内容概要:本文围绕“考虑柔性负荷的综合能源系统低碳经济优化调度”展开,重点研究在碳交易机制下如何实现综合能源系统的低碳化与经济性协同优化。通过构建包含风电、光伏、储能、柔性负荷等多种能源形式的系统模型,结合碳交易成本与能源调度成本,提出优化调度策略,以降低碳排放并提升系统运行经济性。文中采用Matlab进行仿真代码实现,验证了所提模型在平衡能源供需、平抑可再生能源波动、引导柔性负荷参与调度等方面的有效性,为低碳能源系统的设计与运行提供了技术支撑。; 适合人群:具备一定电力系统、能源系统背景,熟悉Matlab编程,从事能源优化、低碳调度、综合能源系统等相关领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①研究碳交易机制对综合能源系统调度决策的影响;②实现柔性负荷在削峰填谷、促进可再生能源消纳中的作用;③掌握基于Matlab的能源系统建模与优化求解方法;④为实际综合能源项目提供低碳经济调度方案参考。; 阅读建议:建议读者结合Matlab代码深入理解模型构建与求解过程,重点关注目标函数设计、约束条件设置及碳交易成本的量化方式,可进一步扩展至多能互补、需求响应等场景进行二次开发与仿真验证。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值