Statistics for Laboratory Scientists ( 140.615 )

Summarizing and presenting data

Data from Sokal & Rohlf, exercise 4.2 (pg 59) [ mg glycine per mg creatine in the urine of 37 chimpanzees ]

x <- c(0.008, 0.018, 0.056, 0.055, 0.135,
       0.052, 0.077, 0.026, 0.044, 0.300,
       0.025, 0.036, 0.043, 0.100, 0.120,
       0.110, 0.100, 0.350, 0.100, 0.300,
       0.011, 0.060, 0.070, 0.050, 0.080,
       0.110, 0.110, 0.120, 0.133, 0.100,
       0.100, 0.155, 0.370, 0.019, 0.100,
       0.100, 0.116)
x
##  [1] 0.008 0.018 0.056 0.055 0.135 0.052 0.077 0.026 0.044 0.300 0.025 0.036 0.043 0.100 0.120 0.110 0.100
## [18] 0.350 0.100 0.300 0.011 0.060 0.070 0.050 0.080 0.110 0.110 0.120 0.133 0.100 0.100 0.155 0.370 0.019
## [35] 0.100 0.100 0.116
length(x)
## [1] 37
str(x)
##  num [1:37] 0.008 0.018 0.056 0.055 0.135 0.052 0.077 0.026 0.044 0.3 ...
class(x)
## [1] "numeric"

Some summary statistics

mean(x)
## [1] 0.1042973
median(x)
## [1] 0.1
min(x)
## [1] 0.008
max(x)
## [1] 0.37
range(x)
## [1] 0.008 0.370
summary(x)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0080  0.0500  0.1000  0.1043  0.1160  0.3700
quantile(x)
##    0%   25%   50%   75%  100% 
## 0.008 0.050 0.100 0.116 0.370
quantile(x,probs=c(0.25,0.75))
##   25%   75% 
## 0.050 0.116
IQR(x)
## [1] 0.066
sd(x)
## [1] 0.08895344
mad(x)
## [1] 0.059304

Some plots

Histograms with different numbers of bins
hist(x)

hist(x, breaks=5)

hist(x, breaks=15)

hist(x, breaks=seq(0,0.4,0.05))

Plot values by index
plot(x)

plot(x, type="l")

plot(x, type="b")

Dot plots
stripchart(x)

set.seed(1)
stripchart(x, method="jitter")

stripchart(x, method="jitter", pch=1)

stripchart(x, method="jitter", pch=1, cex=1.5)

stripchart(x, method="jitter", pch=1, cex=1.5, log="x")

stripchart(x, method="jitter", pch=1, cex=1.5, log="y", vertical=TRUE)

You can change the orientation of the label of the y-axis with the par() graphics function.

par(las=1)
stripchart(x, method="jitter", pch=1, cex=1.5, log="y", vertical=TRUE)

You can specify the width of the rendered plot in the code chunk start.

par(las=1)
stripchart(x, method="jitter", pch=1, cex=1.5, log="y", vertical=TRUE)

Boxplots
boxplot(x)

boxplot(x, range=0)

boxplot(x, range=0, log="y")

boxplot(x, range=0, log="y", col="lightblue")

Arithmetic and geometric mean

mean(x)
## [1] 0.1042973
exp(mean(log(x)))
## [1] 0.07463571

Subsetting and sorting

x[1]
## [1] 0.008
x[-1]
##  [1] 0.018 0.056 0.055 0.135 0.052 0.077 0.026 0.044 0.300 0.025 0.036 0.043 0.100 0.120 0.110 0.100 0.350
## [18] 0.100 0.300 0.011 0.060 0.070 0.050 0.080 0.110 0.110 0.120 0.133 0.100 0.100 0.155 0.370 0.019 0.100
## [35] 0.100 0.116
x[1:5]
## [1] 0.008 0.018 0.056 0.055 0.135
x[-(1:5)]
##  [1] 0.052 0.077 0.026 0.044 0.300 0.025 0.036 0.043 0.100 0.120 0.110 0.100 0.350 0.100 0.300 0.011 0.060
## [18] 0.070 0.050 0.080 0.110 0.110 0.120 0.133 0.100 0.100 0.155 0.370 0.019 0.100 0.100 0.116
x[c(1,7,22)]
## [1] 0.008 0.077 0.060
x<0.1
##  [1]  TRUE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE FALSE FALSE FALSE
## [18] FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE
## [35] FALSE FALSE FALSE
x[x<0.1]
##  [1] 0.008 0.018 0.056 0.055 0.052 0.077 0.026 0.044 0.025 0.036 0.043 0.011 0.060 0.070 0.050 0.080 0.019
sort(x)
##  [1] 0.008 0.011 0.018 0.019 0.025 0.026 0.036 0.043 0.044 0.050 0.052 0.055 0.056 0.060 0.070 0.077 0.080
## [18] 0.100 0.100 0.100 0.100 0.100 0.100 0.100 0.110 0.110 0.110 0.116 0.120 0.120 0.133 0.135 0.155 0.300
## [35] 0.300 0.350 0.370
sort(x, decreasing=TRUE)
##  [1] 0.370 0.350 0.300 0.300 0.155 0.135 0.133 0.120 0.120 0.116 0.110 0.110 0.110 0.100 0.100 0.100 0.100
## [18] 0.100 0.100 0.100 0.080 0.077 0.070 0.060 0.056 0.055 0.052 0.050 0.044 0.043 0.036 0.026 0.025 0.019
## [35] 0.018 0.011 0.008
order(x)
##  [1]  1 21  2 34 11  8 12 13  9 24  6  4  3 22 23  7 25 14 17 19 30 31 35 36 16 26 27 37 15 28 29  5 32 10 20
## [36] 18 33
order(x, decreasing=TRUE)
##  [1] 33 18 10 20 32  5 29 15 28 37 16 26 27 14 17 19 30 31 35 36 25  7 23 22  3  4  6 24  9 13 12  8 11 34  2
## [36] 21  1