COMP2271 DATA SCIENCE 2022Python

Java Python COMP2271-WE01

DATA SCIENCE

2022

Section A Probability

Question 1

(a)  The 26 letters of the alphabet (a,b,. . . ,z) are arranged in random order to produce a string S of length 26 (each permutation is equally likely).

i.  Let A denote the event that S contains the word “durham” .  Calculate the probability P(A). [3 Marks]

ii.  Let B  denote the event that S contains the word  “end” .  Calculate the probability P(B). [2  Marks]

iii.  Calculate the conditional probability P(B | A). [3  Marks]

iv.  Are the events A and B independent? Justify your answer. [2 Marks]

(b)  Log-ins at a server S1  can be modelled as a Poisson process with an arrival rate of 12 log-ins in 24 hours.

i.  Let  A be the event that on a particular day there will be no log-in during 1pm-2pm. Calculate P(A). [2  Marks]

ii.  Let B  be the event that on a particular day there will be two log-ins during 2pm–4pm. Calculate P(B). [2 Marks]

Another server S2  has 20 regular users.  Each of those users logs in exactly once on each day, at a time between 0:00 and 23:59.59 chosen uniformly at random, and nobody else uses the server S2 .

iii.  Let C be the event that on a particular day there will be exactly two log-ins during 2pm–3pm on this server S2 .   Calculate  P(C). [3 Marks]

iv.  Let X  be a random variable that denotes the number of log-ins dur- ing 2pm–3pm on sever S2 .  Calculate the expectation, variance and standard deviation of X . [3 Marks]

(c)  The joint density function of two continuous random variables X and Y is given by

i.  Determine the value of c. [2  Marks]

ii.  Determine the marginal densities fX  of X and fY  of Y. [4 Marks]

Note: If you need to refer to a Z-table to answer the following questions, you can find one on the following pages.

(d)  The annual salaries of data scientists in the UK follow a normal distribution with standard deviation σ = 15,000.  We choose a simple random sample of n data scientists and record their annual salaries.

i.  Describe  how  to determine a two-sided confidence interval  [a,b] so that, with 99% confidence, the true mean of the annual salaries of data scientists in the UK lies in the interval. [4  Marks]

ii.  How  large does the sample size n need to be at least if we want the confidence interval (with 99% confidence as in (i)) to have length at most ε5,000. [4  Marks]

iii.  We choose a sample size of n  = 50,  and the  mean of the salaries in the sample is ε52,000.  Determine a one-sided confidence interval I = (−∞, b] that, with 99% confidence, contains the true mean of the annual salaries of data scientists in the UK. [3 Marks]

(e)  It is commonly accepted that  10% of the users of a social media platform believe in conspiracy theories.  We susp COMP2271 DATA SCIENCE 2022Python ect that the proportion is actually higher.  To investigate this further, we carry out a hypothesis test.  We interview  100  randomly selected  users and  record whether each of them believes in conspiracy theories or not. We find that 15 of the 100 users in the sample believe in conspiracy theories.

i.  Formulate  a  suitable  null  hypothesis  and  a  suitable  alternative  hy- pothesis. [2 Marks]

ii.  Is the test a two-tailed, left-tailed or right-tailed test? [1  Marks] iii. What is the value of the test-statistic z that we should calculate from the sample data? [2 Marks]

iv.  What is the resulting p-value? [2  Marks]

v.  If we choose a significance level of 0.01, how should we formulate the outcome of this hypothesis test? [2  Marks]

vi.  Assume that the true proportion of users who believe conspiracy the- ories is 20%. What is the probability β of a Type II error for our test procedure? [4 Marks]

Section B Computer Graphics

Question 2

This question relates to rendering the steam train model as shown in Figure 1.

Figure 1: Steam train model.

(a)  Assume that when the train translates, its wheels also rotate.  Draw a scene graph for the train model, with the aim of simplifying the graph hierarchy. Marks will be given based on:

i.  Correct structure and organisation of model parts. [8  Marks]

ii.  Correct transformation operations involved. [6  Marks]

(b) Assume that drawbox() and drawcircle() are given functions for you to render a box and a circle with normalised dimensions, respectively.  Write a WebGL code segment based on the scene graph in (a).  Marks will be given based on:

i.  Correct overall program structure. [5  Marks]

ii.  Correct usage of WebGL statements to model train parts and support train motion. [9 Marks]

(c)  Suppose you  have  put 10000 steam train models spreading around a 3D virtual environment for rendering through scan-conversion. When visualis- ing the virtual environment, a user is expected to see some trains moving closely to the  user while other trains  may  be far  away from the  user or temporarily out of the user’s sight.

i.  Which component of the scan-conversion rendering pipeline contributes the most in supporting interactive rendering of the virtual environ-ment? Justify your answer. [5  Marks]

ii.  Analyse why it may still be difficult to render the virtual environment interactively in practice. Suggest a solution  by modifying  the  im-plementation of the virtual environment to significantly improve its rendering speed. [7 Marks]

(d)  To enhance rendering quality of the virtual environment in (c), both direc- tional lighting and normal mapping are applied.

i.  Suggest which shader is suitable for implementing directional lighting. Justify your answer. [4  Marks]

ii.  Analyse  if applying directional  lighting  is sufficient to support  nor- mal mapping.   If yes, justify your answer.   Otherwise, suggest with explanation whether any extra lighting(s) is/are required         

通过短时倒谱(Cepstrogram)计算进行时-倒频分析研究(Matlab代码实现)内容概要:本文主要介绍了一项关于短时倒谱(Cepstrogram)计算在时-倒频分析中的研究,并提供了相应的Matlab代码实现。通过短时倒谱分析方法,能够有效提取信号在时间与倒频率域的特征,适用于语音、机械振动、生物医学等领域的信号处理与故障诊断。文中阐述了倒谱分析的基本原理、短时倒谱的计算流程及其在实际工程中的应用价值,展示了如何利用Matlab进行时-倒频图的可视化与分析,帮助研究人员深入理解非平稳信号的周期性成分与谐波结构。; 适合人群:具备一定信号处理基础,熟悉Matlab编程,从事电子信息、机械工程、生物医学或通信等相关领域科研工作的研究生、工程师及科研人员。; 使用场景及目标:①掌握倒谱分析与短时倒谱的基本理论及其与傅里叶变换的关系;②学习如何用Matlab实现Cepstrogram并应用于实际信号的周期性特征提取与故障诊断;③为语音识别、机械设备状态监测、振动信号分析等研究提供技术支持与方法参考; 阅读建议:建议读者结合提供的Matlab代码进行实践操作,先理解倒谱的基本概念再逐步实现短时倒谱分析,注意参数设置如窗长、重叠率等对结果的影响,同时可将该方法与其他时频分析方法(如STFT、小波变换)进行对比,以提升对信号特征的理解能力。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值