Auditor Federal de Controle Externo - 2022

Página 7 • Total 100 questões

30181Questão 61|Programação|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Considere o código Python a seguir.

[4c16468154071734712fb9979fd8022442646c63ba6f87e25b5b6ed5d05224aa-61-0.jpg]

A execução desse código na IDLE Shell produz, na ordem e exclusivamente, os números:

A
6, 1
B
5, 3, 2001
C
6, 4, 2002
D
1, 3, 2005
E
2, 4, 2006

30182Questão 62|Programação|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Natasha, uma cientista de dados, está trabalhando com um conjunto de dados sobre carros para fazer um modelo preditivo para uma companhia de seguros. A primeira versão do modelo utiliza apenas informações básicas sobre os carros: a marca e a cor.

Como esses dados são categóricos, Natasha faz um pré-processamento usando a biblioteca scikit-learn. Em um ambiente interativo, ela executa os comandos a seguir.

from sklearn.preprocessing import OneHotEncoder >>> enc = OneHotEncoder() >>> X = [['Toyota', 'vermelho'], ['Toyota', 'verde'], ['BMW', 'vermelho']]

enc.fit(X) >>> enc.get_feature_names() array(['x0_BMW', 'x0_Toyota', 'x1_verde', 'x1_vermelho'], dtype=object)

X_prime = enc.transform(X).toarray() >>> X_prime array([[0., 1., 0., 1.], [0., 1., 1., 0.], [1., 0., 0., 1.]])

Para contar o número de carros da marca Toyota no conjunto de dados, obtendo corretamente o resultado 2, Natasha pode usar a seguinte linha de código:

A
len([i for i in X if i == 'Toyota'])
B
len([i for i in X_prime if i[0] == 1])
C
sum([i for i in X if 'Toyota' in i])
D
sum(X_prime)[1]
E
sum(X_prime[:,0])

30183Questão 63|Conhecimentos Bancários|superior

TCU Auditor Federal de Controle Externo

2022

FGV

ATENÇÃO!

Para a questão a seguir, considere uma tabela relacional R, com atributos W, X, Y, Z, e o conjunto de dependências funcionais identificadas para esses atributos.

X → Y

X → Z

Z → X

Z → W

Analise o conjunto de dependências funcionais inferidas abaixo a partir do conjunto de atributos e dependências funcionais presentes na tabela R, como descrita anteriormente.

(1) X → Y Z W (2) X → W (3) X W → Y W (4) X Y Z W → X Y (5) Y → Z

À luz dos axiomas da teoria de projeto de bancos de dados aplicáveis nesse caso, é correto concluir que, dentre essas dependências inferidas:

A
somente 2 é válida;
B
somente 1, 2 e 5 são válidas;
C
somente 1, 2, 3 e 4 são válidas;
D
somente 2, 3, 4 e 5 são válidas;
E
todas são válidas.

30184Questão 64|Informática|superior

TCU Auditor Federal de Controle Externo

2022

FGV

ATENÇÃO!

Para a questão a seguir, considere uma tabela relacional R, com atributos W, X, Y, Z, e o conjunto de dependências funcionais identificadas para esses atributos.

X → Y

X → Z

Z → X

Z → W

Com referência à tabela R, definida anteriormente, considere o esboço de um comando SQL para a criação da tabela.

[4c16468154071734712fb9979fd8022442646c63ba6f87e25b5b6ed5d05224aa-64-0.jpg]

De acordo com as dependências funcionais de R, e com a Forma Normal de Boyce-Codd, a definição correta das chaves (por meio de constraints) aplicáveis e necessárias para essa tabela deveria ser:

A
constraint c1 unique (X) constraint c2 unique (Z)
B
constraint c1 unique (X, Z)
C
constraint c1 unique (X, Y, W)
D
constraint c1 unique (X, Y, Z)
E
constraint c1 unique (X) constraint c2 unique (Y) constraint c3 unique (Z)

30185Questão 65|Atualidades|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Um analista do TCU recebe o conjunto de dados com covariáveis e a classe a que cada amostra pertence na tabela a seguir.

[4c16468154071734712fb9979fd8022442646c63ba6f87e25b5b6ed5d05224aa-65-0.jpg]

Esse analista gostaria de prever a classe dos pontos (1,1), (0,0) e (-1,2) usando o algoritmo de k-vizinhos mais próximos com k=3 e usando a distância euclidiana usual.

Suas classes previstas são, respectivamente:

A
A, B, A;
B
B, A, A;
C
A, B, B;
D
A, A, B;
E
A, A, A.

30186Questão 66|Programação|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Em um problema de classificação é entregue ao cientista de dados um par de covariáveis, (x1 , x2 ), para cada uma das quatro observações a seguir: (6,4), (2,8), (10,6) e (5,2). A variável resposta observada nessa amostra foi “Sim”, “Não”, “Sim”, “Não”, respectivamente.

A partição que apresenta o menor erro de classificação quando feita na raiz (primeiro nível) de uma árvore de decisão é:

A
x1 > 2 (“Sim”) e x1 ≤ 2 (“Não”);
B
x1 > 5 (“Sim”) e x1 ≤ 5 (“Não”);
C
x2 > 3 (“Sim”) e x2 ≤ 3 (“Não”);
D
x2 > 6 (“Sim”) e x2 ≤ 6 (“Não”);
E
x1 > 1 (“Sim”) e x1 ≤ 1 (“Não”).

30187Questão 67|Programação|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Seja uma rede neural com camada de entrada com dimensão dois que recebe dados (x1 , x2 ). Essa rede aplica pesos w1 em x1 , w2 em x2 e adiciona um viés w0 . A função de ativação é dada pela função sinal s(z) = +1, se z ≥ 0, e s(z) = -1, se z < 0. Essa rede não tem nenhuma camada oculta e será utilizada para classificar observações em y=+1 ou y=-1.

Para pesos w1 = 2, w2 = 3 e viés w0 = 1, a região de classificação é uma reta que passa nos pontos:

A
(x1 = -1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como -1 os pontos acima da reta;
B
(x1 = 1/2, x2 = 0) e (x1 = 0, x2 = 1/3) e classifica como +1 os pontos acima da reta;
C
(x1 = -1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como +1 os pontos acima da reta;
D
(x1 = -1/2, x2 = 0) e (x1 = 0, x2 = 1/3) e classifica como +1 os pontos acima da reta;
E
(x1 = 1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como -1 os pontos acima da reta.

30188Questão 68|Administração Geral|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Um analista de dados deseja criar um modelo para classificação de documentos em duas categorias: sigilosos e públicos. À sua disposição, existe um conjunto de dados com N documentos, dos quais uma fração α deles é sigilosa. O analista quer escolher uma fração β dos N documentos para pertencer ao conjunto de teste. O objetivo é garantir que cada uma das classes (documentos sigilosos e públicos) seja responsável, em média, por ao menos 10% do total de documentos. Essa restrição precisa ser válida tanto no conjunto de treino quanto no conjunto de teste. Um par (α,β) que satisfaz as restrições do analista é:

A
α = 20% e β = 70%;
B
α = 30% e β = 80%;
C
α = 40% e β = 60%;
D
α = 60% e β = 80%;
E
α = 70% e β = 20%.

30189Questão 69|Conhecimentos Gerais|superior

TCU Auditor Federal de Controle Externo

2022

FGV

Um analista do TCU gostaria de aplicar um modelo de Latent Dirichlet Allocation (LDA) em um conjunto de textos. A alternativa que melhor descreve o resultado do modelo é:

A
uma lista de tópicos, cada um com um título diferente;
B
uma lista das palavras mais importantes no conjunto de documentos;
C
cada documento é classificado em somente um tópico, onde cada tópico é formado por uma lista de palavras;
D
cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma lista de palavras e cada palavra pertence a somente um tópico;
E
cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma distribuição de probabilidade sobre todas as palavras presentes nos documentos.

30190Questão 70|Programação|superior

TCU Auditor Federal de Controle Externo

2022

FGV

A tabela presente no código em R abaixo apresenta a quantidade de processos analisados por três analistas (denotados por A1, A2 e A3) em diferentes anos.

dados = tibble::tibble(Analista=c(“A1”, “A1”, “A1”, “A2”, “A2”, “A3”, “A3”, “A3”),

Ano=c(2018,2019,2020,2019,2020,2018,2019,2020), Processos=c(10,15,20,25,20,8,7,12))

Um programador roda o código abaixo em R.

tidyr::pivot_wider(data=dados, names_from=”Analista”, values_from=”Processos”)

Os valores esperados na primeira linha do objeto resultante do comando acima são:

A
2018, 10, NA, 8;
B
A1, 10, 15, 20;
C
A1, 2018, 10;
D
2018, 18;
E
A2, 2019, 25.