I wanted to check whether the bases in a read have low quality. The read looks like this in my fastq file:
@M04241:499:GW19092930:1:2112:8740:16257 1:N:0:TGACCT
CGATGTGAGATCCCTCAGACCCTTTTAGTCAGTGGTCCCTTAAGCGGAGGCCCTATAGTGAGTCGTATTACAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAGACCGATCTCGTATGCCGTCTTCTGCTTGAAAAAAAAAAAAAATATATACAACCAAATAAAGATGAAAAAAGAAACTCAATCCAAAAGAAATTGTAGAAGCAAGCTACACAGATTGACCGTAATATTTTCAAACTCAGAGCATGAC
+
CCCCCFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHGGGGGGGGHHHHHHHHHHHGGHHHHHHHHHHHGGGGHHHGGGGGHHHHHHGHHHHHGGGGGGGGF/GGHGGHHHHGGGHGHHHHHHHHHHHHGGGGG<;-;.000000099.:..09CF0000;;;0;;...;/;0:0;;/0;:.;;;B0009000:9FF//.0;0;/9.000;00:-9:A.0:00000009000000/90900
I put these lines in a file 'tmp.fastq'.
I ran fastqc using this command:
% module avail -t | grep -i fastqc [to find the fastqc module on the Sanger farm]
% module load fastqc/0.11.8-c2 [to load the fastqc module on the Sanger farm]
% fastqc tmp.fastq
% unzip tmp_fastqc.zip
% more tmp_fastqc/fastqc_data.txt
This shows me the average base quality drops off a lot after position 145 approximately:
#Base Mean Median Lower Quartile Upper Quartile 10th Percentile 90th Percentile
1 34.0 NaN NaN NaN NaN NaN
2 34.0 NaN NaN NaN NaN NaN
3 34.0 NaN NaN NaN NaN NaN
4 34.0 NaN NaN NaN NaN NaN
5 34.0 NaN NaN NaN NaN NaN
6 37.0 NaN NaN NaN NaN NaN
7 37.0 NaN NaN NaN NaN NaN
8 37.0 NaN NaN NaN NaN NaN
9 37.0 NaN NaN NaN NaN NaN
10-14 37.4 NaN NaN NaN NaN NaN
15-19 38.0 NaN NaN NaN NaN NaN
20-24 38.4 NaN NaN NaN NaN NaN
25-29 39.0 NaN NaN NaN NaN NaN
30-34 39.0 NaN NaN NaN NaN NaN
35-39 39.0 NaN NaN NaN NaN NaN
40-44 39.0 NaN NaN NaN NaN NaN
45-49 38.2 NaN NaN NaN NaN NaN
50-54 38.2 NaN NaN NaN NaN NaN
55-59 39.0 NaN NaN NaN NaN NaN
60-64 39.0 NaN NaN NaN NaN NaN
65-69 38.6 NaN NaN NaN NaN NaN
70-74 39.0 NaN NaN NaN NaN NaN
75-79 38.6 NaN NaN NaN NaN NaN
80-84 38.6 NaN NaN NaN NaN NaN
85-89 38.0 NaN NaN NaN NaN NaN
90-94 39.0 NaN NaN NaN NaN NaN
95-99 38.8 NaN NaN NaN NaN NaN
100-104 38.4 NaN NaN NaN NaN NaN
105-109 38.0 NaN NaN NaN NaN NaN
110-114 33.2 NaN NaN NaN NaN NaN
115-119 38.6 NaN NaN NaN NaN NaN
120-124 38.4 NaN NaN NaN NaN NaN
125-129 38.8 NaN NaN NaN NaN NaN
130-134 39.0 NaN NaN NaN NaN NaN
135-139 38.6 NaN NaN NaN NaN NaN
140-144 33.4 NaN NaN NaN NaN NaN
145-149 16.2 NaN NaN NaN NaN NaN
150-154 15.0 NaN NaN NaN NaN NaN
155-159 19.8 NaN NaN NaN NaN NaN
160-164 24.6 NaN NaN NaN NaN NaN
165-169 17.2 NaN NaN NaN NaN NaN
170-174 23.8 NaN NaN NaN NaN NaN
175-179 15.8 NaN NaN NaN NaN NaN
180-184 21.4 NaN NaN NaN NaN NaN
185-189 21.2 NaN NaN NaN NaN NaN
190-194 24.8 NaN NaN NaN NaN NaN
195-199 16.8 NaN NaN NaN NaN NaN
200-204 23.2 NaN NaN NaN NaN NaN
205-209 18.6 NaN NaN NaN NaN NaN
210-214 21.0 NaN NaN NaN NaN NaN
215-219 16.8 NaN NaN NaN NaN NaN
220-224 18.2 NaN NaN NaN NaN NaN
225-229 22.0 NaN NaN NaN NaN NaN
230-234 15.0 NaN NaN NaN NaN NaN
235-239 16.8 NaN NaN NaN NaN NaN
240-244 14.8 NaN NaN NaN NaN NaN
245-249 18.6 NaN NaN NaN NaN NaN
No comments:
Post a Comment